Департамент анализа данных и машинного обучения

Семантические технологии — это одно из самых актуальных направлений в области интеграции приложений и управления данными. На семинаре ДАДиМО обсудили методы и средства онтологического инжиниринга и основы реализации программных решений Semantic Web.

9 декабря Департамент анализа данных и машинного обучения (ДАДиМО) провел научный семинар «Введение в семантические технологии и базы знаний», в ходе которого доцент, к.э.н. Сергей Вячеславович Макрушин рассказал об истоках возникновения, истории развития, современном состоянии и ключевых вызовах семантических технологий (Semantic Web) и онтологического инжиниринга.

«Применение семантических технологий позволяет перейти от неявной семантики данных, зашитой в приложения и форматы данных, к их семантическому представлению и оперированию на уровне явно описанной информации, навыков или знаний. Станут возможны открытые экосистемы с неограниченным и не заданным на этапе проектирования разнообразием видов информации, типов взаимодействий и видов участвующих агентов, людей и машин», — рассказал Макрушин.


По его словам, одна из задач Semantic Web — выявить методы, которые помогут устройствам и сервисам научиться понимать форматы и данные, с которым они не были ранее знакомы, и суметь с ними взаимодействовать.

Актуальность этой задачи усиливается ростом объема баз данных у крупных организаций, которые требуют регулярного пересмотра структур данных. Упростить этот объединения данных из разрозненных источников в значимую и ценную информацию способно применение семантических технологий.

«Основополагающей схемой в семантической технологии является семантическая сеть. Это знания в виде сети с ориентированными связями. Semantic Web — это общедоступная глобальная семантическая сеть, формируемая на базе всемирной паутины путем стандартизации представления информации в виде, пригодном для машинной обработки. Современный вызов в том, чтобы машины могли работать с этой информацией. Цель — создать машино-читаемый веб с распределенными знаниями с сохранением возможности, когда каждый может выразить данные или знание о чем угодно и связать их с чем угодно».

В ходе семинара Макрушин рассмотрел методологию и инструментарий онтологического инжиниринга. Были рассмотрены такие вопросы, как создание типизированного эмбеддинга, векторного представления объекта (слова, узла сети, понятия базы знаний), и эмбеддинга понятий базы знаний, учитывающего типизацию сущностей и распространенность представителей типа.


В мероприятии приняли участие как сотрудники Департамента анализа данных и машинного обучения, так и студенты, интересующиеся современными направлениями в сфере искусственного интеллекта.