Вячеслав Ерин Видео-курс «Основы теории создания хранилищ данных (DWH)» — Аналитика плюс слив скачать
- Добавлено: 2022-07-04
- Автор курса: DWH,Вячеслав Ерин
- Сайт автора: Перейти
- Доступ: Облако Mail / Yandex / Google
- Скачать: PC / Smartphone / Tablet
Уровень сложности – средний.
Наш видео-курс подойдет для специалистов, желающих научиться проектировать хранилища данных (DWH). В начале курса будет разобрана концепция нормальных форм, с примерами, а затем будут рассмотрены существующие в настоящее время методологии построения хранилищ, от классических (Кимбалл и Инмон) до «современных (Data Vault и Anchor Modeling). В качестве практики будут построены модели хранилища для небольшого интернет-магазина, по каждой из методологий.
Программа видео-курса
Урок 1. Введение: базовые понятия и требования к ХД (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)
— Введение о курсе, содержание курса: теория и практика
— Традиционная архитектура хранилищ данных (ХД)
— Требования к ХД
— Базовая структура ХД: понятия «сырых» данных, метаданных и агрегатов
— ХД с промежуточной областью
— ХД с промежуточной областью и витринами данных
Урок 2. Методологии построения ХД, нормальные формы (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)
— «Классические» подходы к созданию хранилищ: Ральфа Кимбалла и Билла Инмона
— Современные подходы: Data Vault и Anchor Modelling
— Загрузка данных в ХД: ETL и ELT
— Нормализация СУБД: нормальные формы
— Основные термины нормализации: атрибут и домен атрибута, кортеж, отношение, проекция, аномалии и их виды, суперключ и потенциальный ключ, функциональная зависимость
— Сводная таблица существующих нормальных форм
Урок 3. Нормальные формы, подробности (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)
— Пример пошаговой нормализации таблицы
— Первая нормальная форма (1НФ), пример и действия по приведению исходной таблицы к 1НФ
— Вторая нормальная форма (2НФ), пример приведения таблицы из 1НФ во 2НФ
— Третья нормальная форма (3НФ), пример приведения таблицы из 2НФ в 3НФ
— Нормальная форма Бойса-Кодда (НФБК), как частный случай 3НФ
— Четвертая нормальная форма (4НФ), примеры
— Пятая нормальная форма (5НФ), примеры
— Шестая нормальная форма (6НФ), примеры
Урок 4. «Классические» методологии построения ХД – Кимбалла и Инмона
— Две «классические» методологии построения ХД – Ральфа Кимбалла и Билла Инмона, и отличия между ними
— Звезды Ральфа Кимбалла: 4 основных шага в разработке хранилища
— Подход Кимбалла: преимущества и недостатки
— Хранилище 3НФ Билла Инмона, реализация концепции CIF (корпоративной информационной фабрики)
— Основные термины, специфичные для хранилищ 3НФ Билла Инмона
— Подход Инмона: преимущества и недостатки
Урок 5. Практика по методологии Кимбалла
— Практика на примере ХД интернет-магазина
— Исходные данные для ХД
— Практика по Кимбаллу: 2 витрины данных – Платежи и Заказы
— Создание промежуточной области, обзор модели данных
— Обзор исходных данных в mySQL
— Запуск скрипта по созданию объектов промежуточной области, в схеме stage
— Обсуждение ETL-скрипта по переносу данных из mySQL в Vertica
Урок 6. Практика по методологии Инмона
— Запуск ETL-скрипта для варианта ХД по Кимбаллу
— Анализ результатов, проверка, что в stage данные появились
— Обсуждение, что конкретно в данном случае объектами ХД могут быть не таблицы, а представления (view)
— Запуск скрипта создания представлений в схеме stardwh, анализ результатов
— Обсуждение ETL
— Начало практики по Инмону, обзор ETL для варианта по Инмону, обсуждение инкрементальной загрузки и дополнительных сложностей
— Запуск скрипта для создания целевых объектов-«приёмников данных» (до запуска ETL)
— Создание представлений (view) из таблиц, с целью выдачи конечным потребителям доступа к данным, в том виде, в котором им удобно будет воспользоваться
— Сравнение подходов Кимбалла и Инмона
Урок 7. Теория «современности»: детали по методологиям Data Vault и Anchor Modeling
— Краткое напоминание о принципах подходов Data Vault и Anchor Modeling
— Data Vault 2.0: основные понятия, — хаб, спутник (сателлит), ссылка
— Алгоритм создания модели хранилища по методологии Data Vault
— Разбор правил, которых следует придерживаться при моделировании
— Преимущества и недостатки подхода Data Vault
— Anchor Modeling (якорное моделирование): основные понятия, — якорь, атрибут, связь и узел
— Преимущества и недостатки якорного моделирования
Урок 8. Практика по Data Vault
— Обзор исходных данных для практики (напоминание)
— Практика – Data Vault
— Обзор SQL-скриптов, решающих практическую задачу
— Анализ скрипта по созданию представлений (view) промежуточной модели данных, состоящей из хабов, связей и спутников
— Анализ скрипта по созданию «звезды», опирающейся на ранее созданные объекты: от таблиц данных к бизнес-объектам
Урок 9. Практика по Anchor Modeling
— О редакторе якорного моделирования
— Алгоритм действий
— Установка якорей, создание связей между якорями, добавление атрибутов
— Генерация кода для создания объектов БД, реализующего модель
— Просмотр ER-диаграммы модели
— Редактирование якорной модели
— Загрузка данных в созданную модель
— О нюансах ETL-инструментов для якорной модели
— Подведение итогов практикума
Рекомендуемые курсы
Вы научитесь: Введение в ChatGpt и как получить Chatgpt4 по более низкой цене Как создать промпт для вашего видеосценария Как создать тему, конкретный тип видео, целевую аудиторию Настройка промпта для создания видео Как создать короткое видео на Youtube Как создать видеорекламу на Tiktok Как
ClickHouse это одна из самых быстро развивающихся СУБД и платформ для работы с данными. Инвестиции в изучение этого инструмента сейчас, дадут вам большие возможности потом. Для примера, эту СУБД внедрили Spotify и даже Uber! На курсе мы разберемся как оно устроено под капотом, а также напишем много
Аналитика и Data Science для менеджеров и гуманитариев Профкурс по аналитике для социально-экономических направлений. Современные методы поиска скрытых закономерностей. Автор: Nikita Sergeev Курс прошли более 1000 студентов! Средня оценка курса 4,6! Чему вы научитесь Совмещать бизнес- и проф-
Устали анализировать данные и Вам кажется, что это сложно? Вы сможете анализировать данные из внешних источников, таких как базы данных Access, SQL-сервер, OLAP-куб, файлы Excel и т.д., загружая их в модель PowerPivot напрямую или предварительно обработав в PowerQuery. При необходимости создавать
Что вы получите: Разберётесь в метриках и научитесь рассчитывать их с помощью SQL Научитесь сегментировать аудиторию Примените Python для анализа АВ-теста Создадите в Tableau дашборд для мониторинга ключевых метрик Сможете заниматься в удобное время из любой точки мира Пройдёте полный путь
Узнаешь правду о собеседованиях и поймешь, как легко пройти все круги ада и получить тот самый офер 4 часа теории без воды. Получишь доступ сразу к 10 видео с теорией и сможешь изучать их в комфортном темпе. 15 практических занятий. Решишь задачи, которые дают на собеседованиях. Я их проверю и дам
Больше курсов по этой теме
Основы DevOps Изучите основы DevOps — все, что вам нужно знать, чтобы начать применять DevOps Описание Если вы хотите понять DevOps, этот курс предоставит вам базовую информацию о DevOps, включая ключевые понятия и терминологию. Этот курс охватывает полный стек DevOps: люди и культура, процессы и
Рад приветствовать вас на курсе «SQL для всех». Этот курс подойдет: аналитикам; маркетологам; представителям IT-профессий; будущим IT-специалистам; тем, кто плотно работает с данными. Многие, кто решил изучать SQL, забрасывают обучение на первых этапах – оно кажется сложным и неподъемным. Я хочу
Цель этой подборки — стать отправной точкой в будущих изысканиях, этаким стержнем, на который ты смог бы наматывать разбросанные там и тут обрывки ценных знаний. Это не исчерпывающий мануал по хаку всего и вся — объять всю безопасность в пятнадцати статьях невозможно. Но эти статьи дадут тебе
Преимущества курса: ✓ Методология Слёрм Мы расскажем об Apache Kafka в простой и последовательной форме, вам не придется изучать сложную документацию. ✓ Работа на результат Техподдержка поможет каждому студенту справиться с практическими заданиями и добиться поставленных целей. ✓ Курс на русском
Выдача решений с курса SQL для работы с данными и аналитики Трек Продвинутый Решение каждой задачи представляет из себя текстовый файл с SQL кодом, принятым тренажером. Список тем 01 Расчёт бизнес-показателей 1 Расчёт относительных значений. CR (1 задача) 2 Расчёт Lifetime Value (2 задачи) 3 Расчёт
Выдача решений с курса SQL для работы с данными и аналитики Трек Продвинутый/ Самостоятельный проект Решение каждой задачи представляет из себя текстовый файл с SQL кодом, принятым тренажером. Список тем Самостоятельный проект (20 задач)
Отзывы о курсе Видео-курс «Основы теории создания хранилищ данных от Вячеслава Ерина