Курс позволяет освоить профессию инженера данных - востребованную и интересную по специфике. Выпускников ждет работа над проектами и решение задач, которые обывателю кажутся чем-то невозможным.
На курсе слушатели узнают актуальную информацию о приготовлении данных. Otus дает возможность за 5 месяцев погрузиться в работу с загрузкой, обработкой, организацией хранения и доступа к данным с использованием современных инструментов.
Мы изучаем:
Курс подойдет разработчикам, администраторам СУБД и всем, кто стремится повысить профессиональный уровень, освоить новые инструменты и решать задачи в сфере работы с данными.
Опыт разработки на Java/Python
Основы работы с БД: SQL, индексы, агрегирующие функции
Базовые знания ОС: работа с командной строкой, доступ по SSH
Эксперты - опытные педагоги-практики
Занимаясь на курсе, обучающиеся изучают современные инструменты и приобретают навыки работы, которые помогут им эффективно строить карьеру в IT-сфере.
Модуль дает представление о задачах и инструментах работы с данными. По итогам модуля слушатели смогут объяснить и сравнить данные, применить знания и развернуть кластер в облаке.
Итогом модуля станут вычисления, преобразования, агрегации данных (ETL), конечные витрины (для ML / BI) и первая простая модель.
К концу модуля слушатели загрузят данные в файловую систему, изучат форматы, сравнят сжатия и настроят репликацию.
Результаты модуля: добавление stream-источника, создание схемы в хранилище, дизайна и оптимизация под конкретные задачи.
Итогами этого блока станет настройка мониторинга, построение DevOps pipeline и настройка метрики качества данных.
Выпускным проектом станет реализация задачи на выбор в реальном времени. Обязательным будет применение парадигмы Map-Reduce кластере в виде pipeline и визуализация результатов.