[Simulative] Симулятор «SQL для анализа данных» слив скачать
- Добавлено: 2022-05-19
- Сайт автора: Перейти
- Доступ: Облако Mail / Yandex / Google
- Скачать: PC / Smartphone / Tablet
Цели симулятора
Обучить не элементарным «SQL-запросам», а полезным фишкам, экосистеме и продакшен-левел коду
Научить писать запросы, нужные бизнесу. Вы не будете изучать котиков — вы будете считать LTV, делать сложные агрегации и ad-hoc
Погрузить в среду. Вы будете работать с профессиональными инструментами — PostgreSQL, DBeaver, MySQL, Power BI и шедулерами
Чем предстоит заниматься
Писать многочисленные ad-hoc SQL запросы: сбор и валидация email-адресов, расчет статистик пользовательской активности и многое другое
Собирать когорты, анализировать retention, LTV, CR и другие продуктовые метрики с помощью high-level SQL-запросов
Автоматизировать импорт/экспорт данных на Windows/Linux сервере с помощью SQL + Python + psycopg2 + cron
Программа обучения
Симулятор состоит из 13 глав.
Каждая глава — это теория + практические задачи + отработка навыков на бизнесовых кейсах.
Вы будете анализировать пользовательский опыт платформы IT Resume, работать с продакшен-левел инструментами и решать реальные кейсы с интересным сюжетом.
Вы познакомитесь с базами данных, поймете отличие БД от СУБД, обсудите важность нормализации на конкретных кейсах и прочие «основы основ».
В конце - тест для проверки знаний.
Вы научитесь подключаться к удаленной базе 4 разными способами, разберете типы данных и поймете отличие DCL от DML.
Для закрепления знаний - тест.
В этой главе вы научитесь писать базовые SQL-запросы — но далеко не самые простые. Также вы освоите функции обработки текста, даты, времени, кастинга, крутые функции COALESCE/NULLIF, логические операторы, CASE и многое другое. Сортировка, горизонтальная фильтрация, поиск по шаблону, регулярки — все это в этой главе.
Для закрепления — домашнее задание.
Хоть вы только начали путь, вы уже будете решать реальные продуктовые задачи. Например:
Соберете и подготовите базу для email-рассылок
Посмотрите на пользователей в разрезе дат и погрузитесь в обработку даты-времени
Произведете валидацию номеров телефонов
Расклассифицируете задачи на платформе по группам в зависимости от определенного признака
В этой главе мы расскажем про основные продуктовые метрики, которые пригодятся вам абсолютно в любом проекте — будь то мобильное приложение или офлайн-магазин. Например, в следующих главах вы воспользуетесь этими знаниями для аналитики платформы.
Для отработки и закрепления результатов — тест + расчётные задания.
Вы научитесь группировать таблицу по определенным признакам и использовать агрегатные функции: от простейших AVG и MIN до экзотических mode WITHIN GROUP.
Для отработки навыков — домашнее задание.
После этого вы снова отработаете полученные знания на реальных кейсах. Например:
Оцените распределение активности пользователей по часам/дням
Сколько в среднем пользователь делает попыток для решения 1 задачи? А сколько людей решают задачи с первой попытки? А каково значение моды?
Оцените MAU/WAU/DAU
Посчитаете эффективность реферальной программы
Посмотрите на то, как пользователи платформы тратят и копят CodeCoins
Только умея LEFT/RIGHT/FULL/SELF/CROSS/INNER JOIN, мы можем получить действительно что-то полезное и осмысленное. Именно эти конструкции вы и освоите в данной главе.
Для закрепления — домашнее задание.
После этого вы продолжите анализировать user experience платформы. Например:
Посмотрите, кто не только решает задачи, но и участвует в других активностях
Однозначно скажете – от какой компании сколько пользователей пришло и как они себя вели
Оцените распределение решенных задач и тестов по тегам и категориям
Редко решение задачи можно уложить в один короткий запрос. В этой главе вы научитесь писать сложные вложенные подзапросы и выносить все это аккуратно в CTE. А еще обсудим код-стайл и смежные вопросы.
Для закрепления — традиционная домашка.
После этого закрепите все на практике. Например:
Посчитаете RETENTION/CR и подумаем над тем, как удержать пользователей
Углубитесь в то, как пользователи решают задачи и проведете глубокое исследование
Соберете всю статистику о пользователях в одном месте, чтобы показать ее рекрутерам
Разберетесь, в чем мощь window functions, причем здесь вообще окна и как избежать фатальных ошибок при использовании UNBOUNDED FOLLOWING/CURRENT ROW. Также научитесь считать накопительный итог и не только - используя агрегатные функции, как оконные.
Для отработки — полноценное домашнее задание.
Затем вы снова вернетесь к работе над аналитикой платформы. Например:
Снова рассмотрите вопрос retention и LTV, но под новым соусом
Оцените динамику активностей, найдете участки спада и роста
Посчитаете текущий баланс накопительным итогом по всем пользователям и найдете аномалии
В этой главе вы сами запроектируете базу для нового проекта, построите ее схему со связями и напишите все DDL-скрипты для создания. А в конце — развернете ее и в облаке, и на локальной машине! А чтобы базу можно было потестить — наполните ее фейковыми данными (так частенько делают в продакшене) с помощью специальных сервисов.
Будете использовать: draw.io, DBeaver, MySQL + Workbench, сервисы-фейкеры.
В этой главе вы научитесь работать с psycopg2, mysql.connector, узнаете про шаблон проектирования Singleton, научитесь регистрировать собственные типы данных, работать с базой через Python, разберете ошибки типа Authentication plugin ′caching_sha2_password′ cannot be loaded и многое другое.
Для отработки — полноценное домашнее задание.
В результате вы получите:
несколько готовых классов для подключения к основным СУБД, которые вы можете использовать потом на работе
написанные Python-скрипты для экспорта-импорта данных из базы
проект по выгрузке данных из базы и дальнейшей обработке в Pandas
В этой главе вы научитесь автоматизировать типовые задачи: например, бэкапы и инсерты. Делать это будем с помощью cron, шедулера и Python-скриптов. На закуску — Airflow.
На выходе вы будете иметь скрипты и инструкции для автоматизации задач с помощью cron, а также готовый проект с Python-кодом для ежедневного инсерта данных в БД.
SQL тесно связан с аналитикой и датавизом. В этой главе вы будете подключать базу к Power BI и Redash, чтобы строить ad-hoc отчеты и дашборды. Затронем тему подключения по ssh, построения дашбордов и поиска полезных инсайтов.
В результате этой главы вы решите реальное тестовое задание в крупную Edtech компанию на позицию аналитика.
В конце — небольшая ретроспектива всех ваших наработок, а также наши советы относительно тестовых заданий, best practices и дальнейшего развития. Полезные материалы, ссылки и непрошенные советы — то, что нужно в конце такого обучения.
Но на самом деле, это не конец, а только начало интересного пути
Тарифы обучения
Я сам
Рекомендуемые курсы
«Поколение Python»: SQL для начинающих: знакомит с реляционными базами данных знакомит с базовыми возможностями языка SQL В курсе рассматриваются основные понятия реляционных баз данных и языка SQL: группировка, соединения, подзапросы, встроенные функции, пользовательские функции и хранимые
Excel — незаменимый инструмент для бухгалтеров, экономистов, маркетологов, менеджеров, предпринимателей и аналитиков. Но мало кто умеет профессионально им пользоваться. После курса вы поймете, что Excel — это не только таблицы. Чему вы научитесь: Извлекать инсайты для бизнеса, находить
Вы освоите основы важнейших разделов математики: 1) Дискретная математика 2) Математический анализ 3) Линейная алгебра и аналитическая геометрия 4) Теория вероятностей 5) Математическая статистика и элементы аналитики Описание курса Книга природы написана на языке математики. То же самое можно
Расскажем всё о проведении экспериментов в компаниях. На симуляторе вы отработаете на практике сложные и нестандартные ситуации, чтобы избежать ошибок в реальной работе. В бизнесе ежедневно принимаются сотни решений. Часто сложно понять, какое решение будет оптимальным, но цена ошибки при этом
Что вы получите: Разберётесь в метриках и научитесь рассчитывать их с помощью SQL Научитесь сегментировать аудиторию Примените Python для анализа АВ-теста Создадите в Tableau дашборд для мониторинга ключевых метрик Сможете заниматься в удобное время из любой точки мира Пройдёте полный путь
SQL — это язык запросов, который помогает получать из огромной базы данных необходимую информацию в виде структурированного документа. Специалисты, умеющие работать с SQL, могут выгружать, очищать, преобразовывать, защищать, хранить и управлять данными. За 1,5 месяца вы освоите SQL до продвинутого
Больше курсов по этой теме
Как стать специалистом по data science плюс Расширенная программа для тех, кто хочет построить карьеру в сфере data science Цена: 16 000р. / мес. Продолжительность - 16 месяцев (16 частей) Содержание: Начало анализа данных Основы машинного обучения Вспомогательные инструменты Data Science
Часть 8 из 8: 9. Документирование (2 недели): Вы узнаете типы документации, научитесь выбирать оптимальный тип, разрабатывать программу и методику испытаний и руководство пользователя. 10. Выпускной проект (3 недели): Итоговый проект, с помощью которого вы подтвердите приобретенные знания и умения.
Часть 6 из 8: 7. Программные интерфейсы (3 недели): Вы узнаете как информационные системы взаимодействуют между собой и научитесь описывать требования к их взаимодействию. Изучите возможные способы взаимодействия: SOAP, REST, MOM, общая БД, файловый обмен. Научитесь проектировать сервисы, используя
Часть 5 из 8: 6. Требования к пользовательским интерфейсам (3 недели): Вы научитесь разрабатывать интерактивные прототипы пользовательских интерфейсов, изучите типовые паттерны построения интерфейсов и основы UI/UX.
Часть 4 из 8: Состав: Моделирование данных Моделирование данных и работа с БД
Часть 3 из 8: 4. Документирование требований (6 недель): Вы узнаете чего хотят разработчики и как максимально эффективно доносить до них требования. Научитесь применять основные стандарты документирования требований. Узнаете, как проводить ревью требований других системных аналитиков, сопровождать
Отзывы о курсе [Simulative] Симулятор «SQL для анализа данных» от Надежды Майна