Data Science – стремительно развивающаяся область, которая требует от специалистов постоянного следования за новыми трендами. В статье «Data Science с нуля: обзор книг и видеокурсов для начинающих» можно найти необходимые специалисту по анализу данных ресурсы. В очередном обзоре мы предлагаем читателям подборку книг, курсов и блогов 2021 года, актуальных в 2021 году. Здесь вы найдете новости, а также информацию о последних разработках в сфере машинного обучения, больших данных и искусственного интеллекта.
Новы
Practical Weak Supervision: Doing More with Less Data 1st Edition by Wee Hyong Tok, Amit Bahree, Senja Filipi Авторы книги рассказывают читателям, как создавать продукты с использованием слабо контролируемых моделей обучения. Вы также узнаете, как в проектах обработки естественного языка и компьютерного зрения используются слабо маркированные наборы данных из Snorkel – спин-оффа Стэнфордской лаборатории искусственного интеллекта.
TensorFlow 2 Pocket Reference 1st Edition by KC Tung Это карманный справочник по шаблонам проектирования TensorFlow 2 в Python, в котором автор раскрывает различные темы, связанные с корпоративной наукой о данных и практикой машинного обучения. В книге вы найдете ответы на следующие вопросы: как настроить перекрестные проверки в процессе обучения? Как использовать предварительно подготовленную модель с использованием трансфертного обучения и выполнить настройку гиперпараметров? Справочник поможет сэкономить время на поиск вариантов использования TensorFlow и понять практики его рабочих моделей в процессах машинного обучения.
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms 2nd Edition by Nithin Buduma, Nikhil Buduma Второе издание книги, авторы которой простыми словами рассказывают о технологиях и инновациях в сфере Deep Learning. Новые главы посвящены последним достижениям генеративного моделирования. Примеры кода обновлены до TensorFlow 2 и PyTorch 1.4. Книга подойдет владеющим Python программистам и специалистам по Data Science.
Essential Math for Data Science. Take Control of Your Data with Fundamental Calculus, Linear Algebra, Probability, and Statistics by Hadrien Jean Книга предназначена для специалистов по обработке данных, у которых нет математического образования, а также для разработчиков, которые хотят изучить домены данных. Автор рассказывает об основах математики для Data Science, Machine Learning и Deep Learning. Из этой книги вы узнаете, как использовать математическую нотацию для понимания новых достижений в области машинного обучения.
97 Things About Ethics Everyone in Data Science Should Know by Bill Franks В этой книге представлены мнения специалистов из различных компаний, работающих в области технологий, финансов и других отраслей, в которых активно используются методы науки о данных. Эксперты делятся практическим опытом и дают уроки, извлеченными из сбора, управления и анализа данных с этической точки зрения.
Machine Learning with Python. Learn the art of Programming with a complete crash course for beginners. Strategies to Master Data Science, Numpy, Keras, Pandas and Arduino like a Pro in 7 days by Jason Test Сверхбыстрый курс программирования по Python и основам машинного обучения. Книга подойдет абсолютным новичкам, которые хотят освоить науку о данных и искусственный интеллект за короткий срок.
Курсы Data Science Course 2021: Complete Machine Learning Training Новый курс от Udemy, который охватывает основы машинного обучения (рабочий процесс, методы, алгоритмы и инструменты). Он также включает примеры типичных проектов машинного обучения и помогает понять методы решения реальных проблем, связанных с искусственным интеллектом в бизнесе.
Data Analysis Bootcamp – Python, Seaborn and Pandas Интенсивный буткамп для новичков охватывает множество тем – от основ Python до изучения различных типов данных. Вы узнаете, как подготовить данные для анализа, выполнить простой статистический анализ, создать значимые визуализации и предсказать тенденции.
Confetti AI Confetti AI предназначен для начинающих осваивать машинное обучение инженеров. Этот ресурс подготовит вас к тестовым вопросам по теории, включая математику, метрики и Deep Learning. Если вы ищете новую работу или просто хотите освежить знания, Confetti AI предлагает интересный и интерактивный способ это сделать.
Elements of AI The Elements of AI – серия бесплатных онлайн-курсов от Reaktor и Университета Хельсинки. Курс предназначен для широкой публики и людей, которые хотят узнать, что такое искусственный интеллект простыми словами. Программа сочетает теорию с практическими упражнениями и включает множество примеров с иллюстрациями.
Collaborative Working in a Remote Team Двухнедельный курс, с помощью которого вы узнаете об использовании технологий и инструментов для эффективного общения с командой во время удаленной работы. Программа включает стратегии планирования проектов, а также способы, которые помогут вам успешно настроить удаленное рабочее пространство.
Видеолекции Intro to Deep Learning (ML Tech Talks)
Структурированный обзор глубокого обучения от разработчика Google ML. Эксперт проводит разбор обучения признакам, рассказывает о семействе нейронных сетей и их приложениях, а также приводит множество примеров кода и концепций из TensorFlow.
Data Professor
YouTube-канал Чанин Нантасенамата, профессора биоинформатики в Исследовательском университете, где он также возглавляет лабораторию, занимающаяся разработками в области больших данных в медицине. Чанин имеет многолетний опыт работы в области науки о данных. На своем канале с помощью видеолекций и практических тьюториалов он помогает студентам и энтузиастам Data Science освоить машинное обучение, построение нейронных сетей, веб-скрейпинг и многое другое.
Data Science vs Machine Learning vs Artificial Intelligence vs Big Data
Канал Александра Кондуфорова, руководителя направления Data Science Competence в компании AltexSoft. Здесь обсуждаются различия между Data science, машинным обучением, искусственным интеллектом и большими данными.
Deepfake Tutorial | How to Create Deepfake using AI
Из этого туториала для начинающих вы узнаете, как с помощью искусственного интеллекта создать Deepfake с нуля. В урок также включено демо с примером кода.
DeepMind x UCL | Deep Learning Lectures | 7/12 | Deep Learning for Natural Language Processing
В лекции ученого-исследователя DeepMind Феликса Хилла обсуждается мотивация моделирования языка с помощью нейронных сетей. Рассматриваются такие концепции, как Elman’s Finding Structure во времени и в простых рекуррентных сетях, важность контекста и трансформаторов, а также неконтролируемое и репрезентативное обучение языку от Word2Vec до BERT.
Блоги
Inside Big Data Блог посвящен аспектам машинного обучения в области науки о данных и больших данных в ИТ и бизнесе. Особо интересны в нем интервью с выдающимися специалистами, которые делятся опытом работы в индустрии. В этом блоге есть специальные разделы, охватывающие Hadoop, Spark, Developers, Data Science 101, а также публикуются вакансии.
Dataconomy Блог с множеством ресурсов для начинающих специалистов по Data Science. Здесь можно найти подборки и руководства для новичков, а также бесплатные библиотеки ИТ-исследований.
Simply Statistics Этот блог ведут три профессора биостатистики: здесь есть статьи по основам статистики для новичков, а также раздел интервью с опытными младшими специалистами по обработке данных и старшими преподавателями. Основатели блога также являются авторами курсов Data analysis for life sciences и Data Science Specialization on Coursera.
Data Science Report Сайт с множеством статей, курсов, книг, видео- и TED-лекций, которые помогут получить более глубокое понимание науки о данных.
Datafloq Научный блог, созданный Марком Ван Рейменамом – востребованным международным спикером и стратегом в области больших данных, блокчейна и искусственного интеллекта, а также автором трех книг по менеджменту.
Information is beautiful Дэвид Маккэндлесс из Information is Beautiful использует свой блог, чтобы представить проекты в области анализа данных и показать варианты эффективной визуализации. Это отличный пример симбиотической связи между данными и дизайном: цвета, формы и размеры передают массу информации, не занимая много места и увлекая читателя.
Storytelling with data Блог Коул Нуссбаумер Кнафлик – автора одноименной книги, которая использует глубокий, основанный на сторителлинге подход к визуализации данных. Команда SWD привлекает пользователей регулярными статьями, популярным подкастом и развитым пользовательским сообществом.
Flowing Data Основатель блога, статистик Натан Яу, помогает читателям превратить визуализацию данных в непрерывный диалог между читателем и создателем. Его проекты являются блестящими примерами визуализации даже случайной информации.
The Pudding С помощью различных данных Pudding создает ориентированные на взаимодействие с читателем визуальные эссе. Сочетая журналистику данных, визуализацию и веб-инжиниринг, команда Pudding использует экспериментальный и очень индивидуальный подход к визуализации. На сайте вы сможете найти инструменты, примеры кода и туториалы.
Заключение Даже опытные специалисты по Data Science не перестают учится, продолжая искать новые ресурсы и осваивать актуальные знания. Чтобы постоянно следить за обновлениями и новостями отрасли, нужно использовать всевозможные источники – от книг и блогов до подкастов и обзоров конференций.
***
Если вы только начинаете свой путь в Data Science, стоит обратить внимание на курс Факультета Искусственного интеллекта образовательной онлайн-платформы GeekBrains. Рассчитанная на 2 года обучения программа – одна из самых объемных и содержательных на рынке. Она включает основательную математическую подготовку, изучение программирования и статистического анализа, а также работу с базами данных, нейронные сети и машинное обучение. Курс построен на основе практической работы с ведущими специалистами технологических компаний и личным помощником-куратором. Успешно завершившие обучение студенты получат диплом о профессиональной подготовке и помощь в трудоустройстве, а также смогут добавить в портфолио реализованные проекты.
Интересно, хочу попробовать