Модуль 1. "Процесс, стадии и методологии разработки решений на основе ИИ с использованием больших языковых моделей"
- Введение в искусственный интеллект и большие языковые модели
- Процесс и методологии разработки решений на основе ИИ
- Введение в генеративный ИИ и его роль в управлении архитектурой ИИ-системы
- Процесс разработки архитектурного решения ИИ-системы с использованием генеративного ИИ
- Контроль реализации и испытаний, сопровождение эксплуатации программной системы с использованием генеративного ИИ
Модуль 2. "Визуальное описание данных в работе архитектора данных. Проверка целостности. Проектирование интерфейса пользователя данных"
- Грамматика Графики. Коммуникация идей пропорции и неопределенности стейкхолдерам ИИ-решения
- Продвинутые идеи в визуализации данных для архитектора данных
Модуль 3. "Выбор инструментария ML архитектором данных: сравнение возможностей, ограничений и особенностей российских и зарубежных решений"
- Библиотека CatBoost (Яндекс)
- Основные сведения и особености работы TensorFlow/Keras
- Библиотека ETNA (Тинькофф): анализ данных, машинное обучение в ETNA
Модуль 4. "Архитектор поведенческих данных: проверка соответствия архитектуры ИИ-решений, связанных с аналитикой поведения пользователей"
- Введение в анализ поведенческих данных. Анализ реализованной программной системы с использованием причинно-следственной аналитики
- Причинно-следственные диаграммы: построение и уточнение для анализа поведенческих данных
- Экспериментальный дизайн и продвинутый инструментарий анализа поведенческих данных
Модуль 5. "Датацентричное машинное обучение: новый инструментарий архитектора данных"
- Проверка и согласование запросов на изменения программной системы с точки зрения архитектуры
- Инновации в теории искусственного интеллекта и BigData: методы улучшения качества моделей машинного обучения на Big Data c помощью систематической обработки данных
- Алгоритм confident learning и лучшие практики сбора и разметки данных
- Датацентричная оценка моделей машинного обучения: поиск и устранение проблем. Продвинутые способы повышения качества данных
- Проблемы обучения моделей машинного обучения: неравновесие классов, выбросы и сдвиг распределения
- Интерпретируемость в датацентричном машинном обучении
- Кодирование человеческих знаний в машинное обучение через аугментацию данных и инженерию запросов
Итоговая аттестация
Итоговая аттестация в формате защиты проекта.