Профессия Data Engineer

place
Skillfactory
calendar
14 мая
cost
на сайте Skillfactory
duration
10 недель

Дата-инженер собирает данные различных источников, очищает и передаёт аналитикам для принятия решений по развитию бизнеса. Обучение ориентировано на практику и знакомит с основными инструментами инженерии данных. За 2 месяца вы получите необходимые знания и пополните портфолио реальными проектами в Data Engineering.

Карьера

По итогу обучения на курсе вы станете уверенным дата-инженером, составите резюме и опубликуете успешные проекты. Карьерный центр Skillfactory поможет его подготовить, проконсультирует по тонкостям собеседований и поможет с трудоустройством.

Эксперты

Обучать вас будет ведущий Data Engineer «Альфастрахования» с опытом работы в российских и зарубежных компаниях.

expert

Михаил Королев

Ведущий дата-инженер компании «Альфастрахование». Начало работы в IT - 1996 год. Системный программист, руководитель, изобретатель. Серьёзно занимается параллельным программирование. Большой опыт работы в крупном ритейле, страховании, брокерских компаниях. Agile-руководитель
Михаил Королев
Ведущий дата-инженер компании «Альфастрахование». Начало работы в IT - 1996 год. Системный программист, руководитель, изобретатель. Серьёзно занимается параллельным программирование. Большой опыт работы в крупном ритейле, страховании, брокерских компаниях. Agile-руководитель
skill

Для кого

Бизнес-аналитикам. Data Scientist. Аналитикам данных и разработчикам. Менеджерам и руководителям проектов.

skill2

Навыки

Базовый уровень программирования на Python.

Содержание

1. Введение

content

О Data Engineering и важности для него ОС Linux

2. Базы и хранилища данных, их особенности

content

3. Hadoop-экосистема

content

4. Источники данных и работа с ними

content

Рассмотрим файлы как источники данных, разберём структурирование данных (JDBC), научимся использовать SQL для выгрузки.

5. Apache Spark и обработка данных

content

6. Hadoop как хранилище данных

content

Здесь же слушатели познакомятся с особенностями и тонкостями hdfs.

7. Apache Airflow для оркестрации конвейеров

content

Настроим data pipelines.

8. Облачные хранилища и их особенности.

content

Разберём нюансы работы с Google, Amazon, Azure.

platform
Площадка проведения
adress