Approaching (Almost) Any Machine Learning Problem - практическое руководство по прикладному машинному обучению от Абхишека Такура, одного из самых известных Kaggle Grandmaster. Книга не фокусируется на математических деталях алгоритмов, а показывает, как правильно подходить к решению реальных ML-задач.
Автор подробно рассматривает формулировку задач, подготовку данных, работу с категориальными признаками, feature engineering, feature selection и оптимизацию гиперпараметров. Большое внимание уделено стратегиям кросс-валидации, выбору метрик, работе с табличными данными, текстами и изображениями, а также деплою моделей.
Книга предназначена для data scientists, ML-инженеров и аналитиков, которые уже знакомы с основами машинного обучения и хотят улучшить качество своих моделей в практических или соревновательных задачах. Это концентрат практического опыта, который помогает мыслить системно и избегать распространенных ошибок.
Table of Contents
-
Setting up your working environment
-
Supervised vs unsupervised learning
-
Cross-validation
-
Evaluation metrics
-
Arranging machine learning projects
-
Approaching categorical variables
-
Feature engineering
-
Feature selection
-
Hyperparameter optimization
-
Approaching image classification and segmentation
-
Approaching text classification and regression
-
Approaching ensembling and stacking
-
Approaching reproducible code and model serving