1. Feature Engineering and Selection
Авторы: Max Kuhn, Kjell Johnson.
Язык: английский.
Процесс разработки прогнозных моделей включает множество этапов. Большинство ресурсов сосредоточены на алгоритмах моделирования, но игнорируют другие важные аспекты процесса, вроде конструирования и отбора признаков. В этой книге подробно описываются методы поиска наилучших признаков для обучения и повышения производительности моделей машинного обучения.
2. Python Data Analysis: Perform Data Collection, Data Processing, Wrangling, Visualization, and Model Building Using Python
Авторы: Armando Fandango, Avinash Navlani, Ivan Idris.
Язык: английский.
Третье издание практического руководства по изучению конвейеров анализа данных с использованием алгоритмов и методов машинного обучения. С его помощью вы научитесь использовать Python с библиотеками Numpy и Pandas, а также создавать интерактивные визуализации с Matplotlib, Seaborn и Bokeh. Авторы показывают, как извлекать, обрабатывать и хранить данные в широком диапазоне форматов, а также рассказывают о предварительной обработке данных и разработке функций с помощью Pandas и scikit-learn.
Пособие предназначено для аналитиков данных, бизнес-аналитиков, статистиков и специалистов по обработке данных, желающих освоить Python. Студенты и преподаватели также найдут эту книгу полезной.
3. Cleaning Data for Effective Data Science. Doing the other 80% of the work with Python, R, and command-line tools
Автор: David Mertz.
Язык: английский.
В легкомысленном и увлекательном исследовании различных инструментов, методов и наборов данных, реальных и вымышленных, ветеран Python Дэвид Мерц обучит вас всем тонкостям подготовки к анализу. В этой книге собраны основные методы очистки данных. С ее помощью вы изучите общие проблемы с грязными данными и пути разработки гибких решений для их трансформации. Вы научитесь работать с такими форматами, как JSON, CSV, SQL и NoSQL, PDF, двоичными структурами данных, а также с инструментами, вроде Pandas, SciPy, scikit-learn, Tidyverse и Bash.
Книга предназначена для разработчиков программного обеспечения, начинающих и опытных специалистов по обработке данных, преподавателей и студентов.
4. Good Code, Bad Code
Автор: Tom Long.
Язык: английский.
Разработка программного обеспечения – командный вид спорта. Для успешной игры ваш код должен быть надежным и простым для понимания и поддержки. Независимо от того, работаете ли вы в компании, участвуете в проекте с открытым исходным кодом или запускаете стартап, вам необходимо знать разницу между хорошим и плохим кодом. В этом пособие собраны практические методы написания чистого кода от инженера-программиста Google Тома Лонга. Вы узнаете как писать код, который можно легко использовать повторно и быстро адаптировать к новым требованиям. Автор научит вас писать функции, которые читаются как хорошо структурированные предложения; расскажет, как выявить проблемный код и улучшить производительность команды.
Книга предназначена для начинающих программистов, знакомых с объектно-ориентированными языками, вроде Java или C#.
5. Learning MySQL, 2nd Edition
Авторы: Vinicius M. Grippa, Sergey Kuzmichev.
Язык: английский.
Второе издание популярной книги научит читателей проектировать и настраивать эффективные базы, использую последнюю версию MySQL. Независимо от того, развертываете ли вы среду, устраняете неполадки или занимаетесь аварийным восстановлением, это практическое руководство предоставляет информацию и инструменты, необходимые для обширного использования преимуществ MySQL.
Винициус Грипп и Сергей Кузьмичев, инженеры службы поддержки Percona, демонстрируют разработчикам и администраторам баз данных методы минимизации затрат и максимизации доступности и производительности. Вы узнаете, как выполнять базовые и расширенные запросы, осуществлять мониторинг и устранять неполадки, управлять базами данных и безопасностью, настраивать резервное копирование и восстановление.
Эта книга в первую очередь предназначена для новичков в MySQL или тех, кто изучает его в качестве второй базы данных.
Книга в сообществе @progbook.
6. Tableau Desktop Cookbook
Автор: Lorna Brown.
Язык: английский.
Если вы новичок в визуализации данных или уже много лет использующий Tableau джедай, в этой кулинарной книге есть рецепты для всех. Лорна Браун рассказывает, как улучшить панели мониторинга Tableau и помогает читателям понять данные с помощью интерактивной визуализации с Tableau Desktop. В книге также представлено множество онлайн-ресурсов сообщества пользователей Tableau.
Книга в сообществе @progbook.
7. Natural Language Processing Recipes: Unlocking Text Data with Machine Learning and Deep Learning Using Python
Авторы: Akshay Kulkarni, Adarsha Shivananda.
Язык: английский.
Эта книга предназначена для специалистов по обработке данных, которые хотят обновить и изучить различные концепции обработки естественного языка (НЛП) с помощью упражнений по кодированию. Из нее вы узнаете, как эффективно использовать широкий спектр пакетов обработки естественного языка (NLP) для классификации текста, идентификации частей речи, использования тематического моделирования, обобщения текста, анализа настроений, поиска информации и многих других приложений NLP.
Книга начинается с глав, посвященных сбору текстовых данных из различных источников и их очистке. Затем вы исследуете семантический и синтаксический анализ текста, а также комплексные решения NLP, которые включают нормализацию текста, синтаксический анализ, обобщение текста, word2vec и seq2seq. В заключительных главах рассказывается о передовых промышленных приложениях НЛП с внедрением решений и использованием возможностей методов глубокого обучения.
Прочитав эту книгу, вы получите четкое представление о проблемах, с которыми сталкиваются различные отрасли промышленности, и поработаете над множеством примеров внедрения НЛП в реальном мире.
8. Data Science Projects with Python – Second Edition
Автор: Stephen Klosterman.
Язык: английский.
Если вы хотите продвинуться по карьерной лестнице, используя анализ данных и прогнозное моделирование для получения бизнес-информации, эта книга поможет вам в первых шагах. Она предназначена для читателей с базовым опытом программирования и общим интересом к статистике, которые хотят получить практический опыт использования Python и стандартных отраслевых методов, а также библиотек машинного обучения Pandas, Matplotlib, scikit-learn и XGBoost.
Это пособие научит читателей критически думать о данных и использовать их для формирования и проверки гипотез. Вы будете работать над сквозным проектом, основанном на реалистичном наборе данных и разделенном на практические упражнения. Это обновленное издание также включает совершенно новый контент о XGBoost, ценностях SHAP, алгоритмической справедливости и этических проблемах развертывания модели в реальном мире.
К концу книги вы получите навыки, понимание и уверенность, необходимые для создания собственных моделей машинного обучения и получения информации из реальных данных.
Первое издание книги в сообществе @progbook.
9. Practical Machine Learning for Computer Vision
Авторы: Valliappa Lakshmanan, Martin Görner, Ryan Gillard
Язык: английский.
В этой практическом пособии показано, как использовать модели машинного обучения для извлечения информации из изображений. Книга предназначена для инженеров машинного обучения и специалистов по обработке данных, которые хотят научиться решать различные проблемы с изображениями, включая классификацию, обнаружение объектов, автокодеры, генерацию изображений, подсчет и субтитры с помощью проверенных методов ML.
Эта книга представляет собой введение в комплексное глубокое обучение: создание набора данных, предварительная обработка данных, проектирование моделей, обучение моделям, оценка, развертывание и интерпретируемость.
Инженеры Google Валлиаппа Лакшманан, Мартин Гернер и Райан Гиллард покажут вам, как разрабатывать модели ML для компьютерного зрения и внедрять их в производство.
Книга в сообществе @progbook.
10. Becoming a Data Head: How to Think, Speak, and Understand Data Science, Statistics, and Machine Learning
Авторы: Alex J. Gutman, Jordan Goldmeier.
Язык: английский.
В этой книге известные Data Scientists, Алекс Гутман и Джордан Голдмайер, приоткрывают завесу над наукой о данных и предоставляют вам язык и инструменты, чтобы говорить и критически думать о данных. Авторы научат читателей задавать правильные вопросы о статистике и результатах, с которыми вы сталкиваетесь на рабочем месте, понимать, что на самом деле происходит с машинным обучением, текстовой аналитикой, глубоким обучением и искусственным интеллектом, а также избегать распространенных ошибок при работе с данными и их интерпретации.
Книга предназначена для тех, кто хочет начать работать с данными и руководить их анализом, начиная от личностей, с которыми придется работать, и заканчивая математикой, лежащей в основе алгоритмов.