Кафедра анализа данных и машинного обучения Факультета информационных технологий и анализа больших данных

Петросов Давид Арегович

Ведущий научный сотрудник

Чатбот

Вопрос-ответная система на естественном языке. Платформа на базе алгоритмов глубинного машинного обучения для создания разговорного искусственного интеллекта, призванного отвечать на вопросы в заданной предметной области с помощью данных из крупной универсальной базы знаний (Wikidata). Отличается низкой долей неверных ответов.

В ходе исследовательского проекта решены следующие задачи:

      Структурирование вопросов в рамках предметной области

      Создание методологии, сбор и разметка большого объема исходных данных (вопросов)

      Идентификация сути запроса (интента)

      Выявление нетипичных именованных сущностей и сущностей с привязкой к ее типу

      Создание локальной версии крупной универасальной базы знаний

      Нечеткий поиск сущности в базе знаний

      Фильтрация кандидатов с использованием типизации сущностей

      Выбор наилучшего кандидата и признание отсутствия хорошего ответа

      Генерация ответа

Сфера применения: решение может быть использовано для построения вопрос-ответных систем поддержки клиентов, чат-ботов. 

Подробнее о создании чатбота  — в интервью доцента Департамента анализа данных, принятия решений и финансовых технологий Екатерины Владимировны Романовой.

Техническое описание: для построения модели была использована платформа iPavlov, для которой было реализован ряд специализированных компонент и было проведено дообучение нескольких стандартных моделей проекта.

Участники проекта: доцент, к.э.н. С.В. Макрушин, инженеры Н.В. Блохин, Н.А. Титов, бакалавр Е. А. Емелин, доцент, к.ф-м.н. Е.В. Романова

Работа выполнена в рамках коммерческого заказа.