Модуль 1. "Инструменты и методы бизнес-аналитики"
- Примеры аналитических задач. Сбор данных для анализа данных
- Инструмент работы с таблицами в режиме онлайн на примере Google-таблицы.
- Статистика и тестирование гипотез
- Бизнес-показатели и точки роста. Анализ продуктовых метрик
- Финансовые метрики и Маркетинговые метрики.
- Иерархия метрик и разработка отчетности. Дизайн тестов, проведение и анализ. Построение простых моделей
- Промежуточная аттестация
Модуль 2. "Python и анализ данных"
- Python: Jupiter Notebook, комментарии в коде, арифметические операции. Управляющие конструкции и коллекции
- Функции и работа с данными, основы парсинга. Работа с файловой системой и модули
- Регулярные выражения и основы синтаксического разбора. Исключения и обработка ошибок
- Функции и понятие класса. Библиотека NumPy: вычислительные задачи
- Библиотека Pandas: возможности и оптимизация. Методы оптимизации Pandas
- Корреляция и корреляционный анализ. Статистическая проверка гипотез, A/B-тесты
- Промежуточная аттестация
Модуль 3. "SQL и получение данных"
- Введение в SQL. Установка и знакомство. Основы и работа с базами данных
- Основы SQL. Базовые запросы SQL. Фильтрация данных
- Углубление в SQL. Агрегация данных. Группировка данных. Join. Оконные функции
- Работа с PostgreSQL
- "NoSql & MongoDB"
- Примеры создания дашбордов и анализ продуктовых метрик с применением SQL.
- Промежуточная аттестация
Модуль 4. "Визуализация данных"
- Анализ данных средствами Microsoft Excel
- Визуализация данных: основные BI -инструменты
- DataLens: быстрый анализ данных с визуализацией
- Power BI. Построение моделей данных из разных неструктурированных источников: таблиц, сайтов и баз данных
- Tableau. Основы работы с расчётными полями, фильтрами, множествами и группировками. Основные виды визуализаций. Лучшие практики визуализации
- Создание интерактивных дашбордов
- Промежуточная аттестация
Модуль 5. "Основные методы машинного обучения"
- Понятие машинного обучения. Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
- Классификация. Логистическая регрессия и SVM
- Функции потерь и оптимизация Оценка точности модели, переобучение, регуляризация
- Проблема качества данных, пропуски и переменные
- Деревья решений, поиск выбросов и генерация новых признаков
- Алгоритмы кластеризации, улучшение качества модели.
- Промежуточная аттестация
Модуль 6. "Глубокое машинное обучение и обработка больших данных"
- Машинное обучение и Data Science Мотивация и технологии работы с большими данными. Основные инструменты обработки больших данных. HADOOP & SPARK
- Рекомендательные системы
- Методы анализа временных рядов, модели ARIMA, GARCH
- Обработка естественного языка
- Компьютерное зрение, сегментация и детекция объектов
- Машинное обучение, подготовка модели по практическому кейсу
- Промежуточная аттестация
Итоговая аттестация
Итоговая аттестация проходит в формате защиты итогового практического задания.