Модуль 1. "Python и анализ данных"
- Инструменты и методы бизнес-аналитики. Python: Jupiter Notebook, комментарии в коде, арифметические операции. Управляющие конструкции и коллекции.
- Функции и работа с данными, основы парсинга. Работа с файловой системой и модули.
- Регулярные выражения и основы синтаксического разбора. Исключения и обработка ошибок
- Функции и понятие класса. Библиотека NumPy: вычислительные задачи
- Библиотека Pandas: возможности и оптимизация. Методы оптимизации Pandas
- Корреляция и корреляционный анализ. Статистическая проверка гипотез, А/В-тесты
- Промежуточная аттестация
Модуль 2. "SQL и получение данных"
- Введение в SQL. Установка и знакомство. Основы и работа с базами данных
- Основы SQL. Базовые запросы SQL. Фильтрация данных
- Углубление в SQL. Агрегация данных. Группировка данных Join. Оконные функции
- Работа с PostgreSQL
- "NoSql & MongoDB"
- Примеры создания дашбордов и анализ продуктовых метрик с применением SQL.
- Промежуточная аттестация
Модуль 3. "Визуализация данных"
- Анализ данных средствами Microsoft Excel
- Визуализация данных: основные ВІ-инструменты
- DataLens: быстрый анализ данных с визуализацией
- Power BI. Построение моделей данных из разных неструктурированных источников: таблиц, сайтов и баз данных
- Tableau. Основы работы с расчётными полями, фильтрами, множествами и группировками. Основные виды визуализаций. Лучшие практики визуализации
- Промежуточная аттестация
Модуль 4. "Глубокое машинное обучение и обработка больших данных"
- Машинное обучение и Data Science. Основные методы машинного обучения. Мотивация и технологии работы с большими данными. Основные инструменты обработки больших данных. HADOOP & SPARK
- Рекомендательных системы
- Методы анализа временных рядов, модели ARIMA, GARCH
- Обработка естественного языка
- Компьютерное зрение, сегментация и детекция объектов
- Машинное обучение, подготовка модели по практическому кейсу
- Промежуточная аттестация
Итоговая аттестация
Итоговая аттестация в формате защиты итогового практического задания.