ОПИСАНИЕ КУРСА

Практический MLOps

Модели не могут сами по себе добраться до промышленного использования и начать приносить деньги бизнесу. Для этого необходимо много ресурсов разработчиков и аналитиков, помимо самих Data Scientists и качественно проработанный жизненный цикл моделей.

В этом курсе мы расскажем, что такое ModelOps и MLOps и какие между ними существуют различия:
  • подробно опишем, как правильно выстроить рабочее место Data Scientistа и какие технологии и инструменты для этого следует использовать,
  • затронем тему версионирования данных и управления пайплайнами обучения моделей для обеспечения воспроизводимости модельных экспериментов.
Все это необходимо для того, чтобы упростить процесс внедрения моделей, автоматизировать как можно больше его частей и минимизировать человеческий фактор, соответственно, снизить модельный риск.

ОПИСАНИЕ ПРОГРАММЫ КУРСА ПО ДНЯМ

День 1
Организация работы Data Scientist над проектом
  1. Структура проекта/репозитория разработки моделей, шаблоны проектов,
  2. Управление окружениями,
  3. Версионирование Jupyter Notebooks,
  4. Использование линтеров и бьютифаеров,
  5. Документирование кода и проекта,
  6. Тестирование и его значимость,
  7. Работа с инструментами: Git, Gitflow, JupyterHub.
День 2
Версионирование данных
на примере DVC
  1. Роль версионирования данных,
  2. DVC как пример OpenSource инструмента. Основные цели и принципы,
  3. Версионирование, загрузка/выгрузка данных
  4. с использованием технологии DVC,
  5. Конвейеры обработки данных и воспроизводимость,
  6. DVC Studio,
  7. FeatureStore.
День 3
Управление экспериментами
в MLFlow
  1. MLFlow как основной инструмент для управления экспериментами. Основные компоненты,
  2. Упаковка кода моделирования с MLFlow Project,
  3. Регистрация экспериментов с помощью MLFlow Tracking,
  4. MLFlow Model Registry как централизованное хранилище моделей,
  5. Формат MLFlow Models,
  6. DVC эксперименты.
День 4
Внедрение моделей
и автоматизация процессов
  1. Основные подходы к внедрению моделей. Внедрение и эксплуатация моделей.
  2. Пайплайны применения моделей (Prefect, Kuberflow pipelines, Airflow)
  3. Внедрение на примере контейнеризированного приложения (Docker и Kubernetes)
  4. Обзор внедрения и сервинга моделей с помощью различных инструментов
  5. Процессы и технологии CI/CD. Пайплайны внедрения и автоматизации тестирования
День 5
Мониторинг, Переобучение,
Model Governance, Управление Жизненным Циклом Моделей
  1. Важность мониторинга в проектах ML. Виды мониторинга, подходы, инструменты,
  2. Валидация моделей,
  3. Переобучение и калибровка моделей. Самопереобучаемые алгоритмы,
  4. Model Governance,
  5. Управление жизненным циклом моделей в целом.
A²NCED
Запишитесь на курсы A2NCED
Какой курс вам интересен?
Я представляю
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь
c политикой конфиденциальности

Узнавайте об обновлениях
и новых курсах первыми!

Подписывайтесь на наше коммьюнити NoML (Not only Machine Learning), где мы публикуем все новости, общаемся и делимся мнениями об индустрии