Машинное обучение на Python в реальных проектах

Основное внимание в курсе уделено реальным кейсам применения машинного обучения для решения бизнес-задач с использованием Python и его экосистемы. Курс проводится в формате лекций и практических занятий, что позволяет сразу применять полученные знания в реальных проектах. В программе предусмотрены домашние задания и командные проекты, выполняемые после учебного дня, что способствует глубокому усвоению материала и подготовке к профессиональной деятельности в сфере ML.

Целевая аудитория

программа предназначена для специалистов по анализу данных, разработчиков, аналитиков и IT-менеджеров, стремящихся освоить современные методы машинного обучения и их применение в реальных проектах. Курс подходит как для начинающих специалистов, так и для тех, кто хочет углубить свои знания и получить практический опыт в создании и интеграции ML-решений

Цель курса - формирование практических навыков разработки, оптимизации и интеграции моделей машинного обучения на Python для решения реальных задач. Обучение сбору, обработке и анализу данных, построению моделей с использованием классических алгоритмов и глубокого обучения, а также внедрению готовых решений в производственные процессы.

Предварительные требования

базовые знания Python
элементарные представления статистики, линейной алгебры и анализа данных
навыки работы с ПК и понимание принципов обработки информации

Приобретаемые знания и навыки

По окончании курса слушатели смогут:

разрабатывать и оптимизировать ML-модели для реальных задач
проводить предобработку, анализ и визуализацию данных с использованием современных библиотек Python
интегрировать ML-решения в бизнес-процессы и приложения
применять методы оценки и валидации моделей для повышения их эффективности
реализовывать end-to-end проекты с учетом современных практик MLOps

Программа курса

Модуль 1: Введение в машинное обучение и подготовка данных

Обзор машинного обучения в реальных проектах. Тренды, кейсы из индустрии и примеры успешных решений
Python для ML: инструменты и библиотеки. Обзор экосистемы: scikit-learn, pandas, NumPy, matplotlib
Сбор данных и источники информации. API, базы данных, веб-скрейпинг
Предобработка и очистка данных. Трансформация, нормализация, обработка пропусков
Визуализация данных для аналитики. Построение графиков с использованием matplotlib, seaborn, Plotly
Практическое занятие: подготовка реального набора данных для последующего анализа

Модуль 2: Классические алгоритмы машинного обучения

Супервизированное обучение: регрессия и классификация. Линейная регрессия, логистическая регрессия, SVM
Деревья решений и ансамблевые методы. Random Forest, Gradient Boosting, XGBoost
Несупервизированное обучение. Кластеризация (K-means, иерархическая кластеризация), понижение размерности (PCA)
Оценка качества моделей. Кросс-валидация, метрики (точность, recall, F1-мера и др.)
Практическое занятие: разработка модели для задачи предсказания оттока клиентов или другого бизнес-кейса

Модуль 3: Применение глубокого обучения в реальных проектах

Основы нейронных сетей и глубокого обучения. Архитектура, функции активации, концепция обучения
Создание нейронных сетей с TensorFlow и Keras. Построение, обучение и оптимизация моделей
Обработка изображений и текста. Сверточные нейронные сети (CNN) и рекуррентные сети (RNN, LSTM)
Интеграция OpenCV для задач компьютерного зрения. Предобработка изображений, детекция объектов, применение в проектах
Практическое занятие: реализация проекта: разработка модели для распознавания образов или анализа текстовых данных

Модуль 4: Разработка end-to-end ML-решений

Проектирование прототипа ML-проекта. Постановка задачи, определение KPI и бизнес-логики
Интеграция модели в приложение. Создание REST API с использованием Flask или FastAPI
Интеграция с бизнес-процессами. Автоматизация, обработка потоковых данных и A/B тестирование
Практическое занятие: разработка прототипа решения с интеграцией ML-модели в веб-сервис

Модуль 5: MLOps и развёртывание моделей в продакшн

Введение в MLOps. Принципы CI/CD, автоматизация и мониторинг ML-моделей
Контейнеризация и облачные решения. Docker, Kubernetes и развёртывание на AWS, GCP или Azure
Мониторинг и обновление моделей. Методы отслеживания качества модели и реагирование на дрифт данных