Машинное обучение

Выпускники курсов HiBrain получают уникальную возможность применить новые знания: компании-партнёры проекта ждут наших слушателей на стажировки и предлагают трудоустройство.

  • Площадка:Bigdata Team
  • Продолжительность:1 месяц
  • Дата:по мере набора группы
  • Стоимость:59900 ₽

О курсе

Эксперты с опытом работы в NVIDIA, Coursera, Яндекс, Amazon AWS, Sberbank, Raiffeisenbank и CERN, преподаватели Coursera, МГУ, МФТИ, ВШЭ, Harbour.Space University научат участников работать с нейронными сетями, обучать ансамбли деревьев, расскажут, как правильно использовать инструменты для работы с большими данными.

    Кому подойдет курс

    • Обучение рассчитано на специалистов с опытом программирования на Python и базовыми знаниями в математике (матрицы, производные)

    Требования к курсу

    • Опыт программирования на Python и базовые знания в математике (матрицы, производные)

    Эксперты

    Друзья HiBrain — ведущие IT-компании. Вместе с ними мы разрабатываем программы курсов, чтобы наши слушатели получили самые актуальные знания и навыки. Эксперты из компаний-партнёров помогают нам в подготовке практических кейсов и даже принимают экзамены у выпускников.

    • Алексей Драль
      Founder & СEO, BigData Team, читает курс "Введение в машинное обучение и библиотеки ML для Python", "Линейные модели, регуляризация, SVM, метрики качества", "Обучение без учителя (Unsupervised Learning)"
    • Дмитрий Игнатов
      Заведующий лабораторией моделей и методов вычислительной прагматики, ВШЭ, читает курс "Деревья", "Ансамбли решающих деревьев"
    • Радослав Нейчев
      Senior Quantitative Analysis Officer, Raiffeisenbank, читает курс "Нейронные сети и введение в глубокое обучение (Deep Learning)","Deep Learning: CNN, RNN, Attention"
    • Павел Клеменков
      Chief Data Scientist (Data Platform), NVIDIA, читает курс "Погружение в большие данные (Big Data)"

    Карьера

    Выпускники курсов HiBrain получают уникальную возможность применить новые знания: компании-партнёры проекта ждут наших слушателей на стажировки и предлагают трудоустройство.

      Программа курса

      Базовые операции с данными в numpy, построение графиков функций с matplotlib. Оптимизация функций с помощью scipy. Ввизуализация данных с помощью seaborn. Базовый конвейер обработки данных и построение первой модели с помощью sklearn

      Применение алгоритмов Scikit-learn к синтетическому набору данных и к данным соревнования Kaggle Inclass (классификация, регрессия). Логистическая регрессия, практика обучения моделей с помощью SGD. Метод опорных векторов (Support Vector Machine), ядра. Настройка параметров, кросс-валидация, предобработка данных (строки, пропуски, категориальный признаки)

      Практика обучения деревьев на наборах данных (MNIST, UCI, кредитный скоринг). Визуализация деревьев. Работа с признаками и пропущенными значениями в деревьях. Практические аспекты - оценка времени работы, прунинг деревьев

      Общие методы построения композиций - усреднение, бустинг, блэндинг, стэкинг. Бустинг и GBM. Выбор параметров в ансамблях решающих деревьев. Сравнение Random Forest и GBDT с демонстрацией. Связь корреляция между ответами моделей и качеством модели в бэггинге. Bias-variance trade-off на примере бэггинга и бустинга. Преимущества и недостатки RF и GBDT. XGBoost, LightGBM

      Нейронные сети и сверточные нейронные сети, общие веса, локальность иерархичность. Слои в сверточных сетях, функции потерь для классификации, регуляризация нейросетей. Эффективный методы вычисления градиентов, проверка реализации разностным дифференцированием

      Рекуррентные нейронные сети в задаче анализа сигналов и естественного языка. Генеративные модели на основе RNN. Механизм внимания (Attention mechanism) в задаче машинного перевода и других задачах. Сверточные нейронные сети в задачах обработки текста, сравнение с рекуррентными нейронными сетями. DNN на практике: инициализация, предобработка данных, модельный зоопарк, дообучение, вычисления на видкеокартах, визуализация

      Определение координат дома и работы человека по GPS-треку (определение регулярных координат с помощью DBSCAN). Метод главных компонент на практике. Применение PCA и tSNE для визуализации данных, сжатия данных, предобработки датасета

      Hadoop, HDFS, MapReduce, Spark