Евгений Ермаков, Валерий Соколов «Инженер данных. Все части» — Karpov.Courses слив скачать
- Добавлено: 2023-09-22
- Автор курса: Евгений Ермаков, Валерий Соколов
- Сайт автора: Перейти
- Доступ: Облако Mail / Yandex / Google
- Скачать: PC / Smartphone / Tablet
Обучающие выборки для машинного обучения и красивые графики для отчётов не появляются сами собой: данные нужно собирать, хранить, валидировать и комбинировать между собой, быстро реагируя на изменения в их структуре.
ДЛЯ КОГО ЭТОТ КУРС:
ИНЖЕНЕР ДАННЫХ
Уже работаете с хранилищами данных, но хотите систематизировать знания и глубже погрузиться в актуальные технологии.
АНАЛИТИК ДАННЫХ
Постоянно взаимодействуете с базами данных, но хотите лучше разобраться в ETL-процессах и выйти на качественно новый уровень в аналитике.
BI-РАЗРАБОТЧИК
Занимаетесь развитием систем бизнес-аналитики, хотите освоить архитектуру современных хранилищ данных и научиться их проектировать.
BACKEND-РАЗРАБОТЧИК
Имеете опыт бэкенд-разработки и хотите применить его для решения задач, связанных с хранением и обработкой больших данных.
РАБОТАЙТЕ С ДАННЫМИ В ЛЮБЫХ СИСТЕМАХ
— Изучайте архитектуру хранилищ данных и подходы к их проектированию
— Сравнивайте на практике Big Data решения на базе Hadoop и реляционные MPP СУБД
— Учитесь работать с облаками и автоматизировать ETL-процессы с помощью Airflow
ПРОГРАММА КУРСА
1. РЕЛЯЦИОННЫЕ И MPP СУБД
Начнём погружение в инженерию данных со знакомства с реляционными и MPP базами данных. Рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях MPP СУБД оказываются лучше традиционных. Научимся готовить PostgreSQL и MPP базы данных на примере Greenplum.
2. АВТОМАТИЗАЦИЯ ETL-ПРОЦЕССОВ
ETL — ключевой процесс в управлении хранилищами данных. Рассмотрим принципы и основные этапы его построения. Познакомимся с популярным инструментом Airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать ETL-пайплайны.
3. BIG DATA
Познакомимся с механизмами распределённого хранения больших данных на базе Hadoop, разберём основные паттерны реализации их распределённой обработки. Рассмотрим вопросы отказоустойчивости и восстановления после сбоев. Поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий Spark.
4. ПРОЕКТИРОВАНИЕ DWH
Data Warehouse — централизованное хранилище данных из разных источников. Познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя DWH.
5. ОБЛАЧНОЕ ХРАНИЛИЩЕ
Рассмотрим облачные решения и инструменты для построения DWH и Data Lake. Познакомимся с Kubernetes и научимся применять его для работы с данными. Поработаем с облаком на практике, рассмотрим процесс установки и настройки JupyterHub и Spark в Kubernetes.
6. ВИЗУАЛИЗАЦИЯ ДАННЫХ
Рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. Познакомимся с Tableau — гибким и мощным BI-инструментом. Узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга DWH платформы.
7. BIG ML
Познакомимся с теорией распределённого машинного обучения. Научимся работать с популярным модулем Spark ML и рассмотрим подходы к обучению и применению моделей на больших данных.
8. УПРАВЛЕНИЕ МОДЕЛЯМИ
В работе инженеры часто сталкиваются с подготовкой данных для обучения ML-моделей. Рассмотрим инструменты для построения ML-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.
9. УПРАВЛЕНИЕ ДАННЫМИ
На практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. Познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.
Купить другие курсы и тренинги от Евгения Ермакова, Валерия Соколова
Рекомендуемые курсы
Цель нашего курса — помочь опытным аналитикам расширить свои компетенции и задать правильное направление для дальнейшего развития в профессии. Полученный практический опыт позволит углубить знания в области продуктовой аналитики и научиться подбирать правильные инструменты для решения задач в самых
Для кого эта программа: - Старт карьеры. У вас нет опыта в анализе данных, но вы хотите начать карьеру в аналитике. Наш курс предполагает, что вы владеете математикой хотя бы на школьном уровне. Остальному научим мы! - Уже работаете в аналитике. Вы сможете дополнить арсенал своих знаний такими
Базовая версия ДЛЯ КОГО ЭТОТ КУРС: 1. Продакт-менеджер - Работаете над развитием продукта и хотите научиться принимать решения на основе data-driven подхода. 2. Аналитик - Занимаетесь анализом бизнес-метрик и хотите на практике разобраться во всех тонкостях A/B-тестирования. Подойдёт всем, кто
Работа над реальным проектом под руководством ведущих аналитиков. Анатолий Карпов расскажет о курсе и его технических аспектах. Вы узнаете, что такое симулятор, какие задачи будете решать и в чём ценность симулятора. Программа напоминает стажировку, где вам придется разобраться с АБ тестами,
Вы получите: материалы курса в записи. Тестировщик создаёт сценарии тестирования, прогнозирует сбои и находит ошибки в продуктах. Вы освоите тест-дизайн и овладеете инструментами Postman, Charles, Яндекс.Трекер. Чтобы изучить основы автоматизации тестирования, вы познакомитесь с jаvascript и
НА КУРСЕ ТЫ ГЛУБОКО ПОГРУЗИШЬСЯ В МИКРОСЕРВИСЫ: Освоишь базовое использование протокола http в Golang-приложениях На практике научишься применять архитектурные подходы построения сервисов Освоишь работу с PostgreSQL, написав свои компоненты-заготовки, упрощающие дальнейшую разработку Поработаешь с
Больше курсов по этой теме
Этот курс проведет вас через весь процесс разработки профессиональных веб-приложений с помощью Django и Django REST Framework. Все лекции посвящены объяснению механизмов работы веб-фреймворка Django путем написания нескольких проектов на Python с нуля и последующим их деплоем на сервер. В курсе 118
Освойте за 8 дней сразу 2 перспективных интернет-профессии с доходом от 95 000 и получайте заказы из любой страны мира За пару вечеров Вы САМИ создадите чат-бота для Viber, Facebook, ВК или Telegram, найдете первого клиента и даже, возможно, получите предоплату. Для кого этот курс?
Программирование на QLua для QUIK Создай своего робота Сложность: Новичок Евгений Ни Программирование, роботы и алготорговля Что это Не секрет, что 99% торгующих на бирже сливают свой капитал. В этом виновата в большей степени человеческая психология. Нас с детства учат: «Лучше синица в руках, чем
НА КУРСЕ ТЫ ГЛУБОКО ПОГРУЗИШЬСЯ В МИКРОСЕРВИСЫ: Освоишь базовое использование протокола http в Golang-приложениях На практике научишься применять архитектурные подходы построения сервисов Освоишь работу с PostgreSQL, написав свои компоненты-заготовки, упрощающие дальнейшую разработку Поработаешь с
Курс «Разработка ТЗ на информационную систему» включает теоретические знания и практические навыки, необходимые для самостоятельной разработки технического задания на программное обеспечение, информационную или автоматизированную систему. На курсе вы освоите методы и средства трассировки
Асинхронный Python Курс содержит всё, что вам нужно знать о асинхронном Python, от основ до продвинутых тем. Вы получите доступ к обширному набору материалов и задач, которые постоянно обновляются и дополняются, чтобы оставаться актуальными и полезными. Не упустите свой шанс стать частью нашего
Отзывы о курсе «Инженер данных. Все части» от Евгения Ермакова, Валерия Соколова