Департамент анализа данных и машинного обучения

Доцент Департамента анализа данных и машинного обучения Никита Андреевич Андриянов предложил новый подход к повышению эффективности распознавания образов на нестандартных типах изображений на примере радиолокационных изображений местности и рентгеновских снимков багажа и ручной клади. 

Для улучшения качества работы сверточных нейронных сетей, которые использовались для классификации радиолокационных изображений, была применена модификация алгоритма градиентного спуска и аугментация данных для обучения. Благодаря такому подходу удалось добиться того, что доля правильных распознаваний составила свыше 90%. При этом для большинства изображений вероятность принадлежности к конкретному классу была также порядка 90% и более. Одна из модификаций алгоритма обеспечила 100% распознаваемость на обучающей и тестовой выборке. Однако для будущей апробации алгоритма требуется увеличение числа изображений в тестовой выборке.


Разработка алгоритма для распознавания запрещенных и разрешенных к проносу предметов на изображениях, полученных при сканировании багажа в аэропорту, выполнялась в условиях малых вычислительных затрат, а именно обучение происходило с использованием малопроизводительного компьютера. Вероятность правильного распознавания составила более 90% на тестовой выборке.  

Исследование стандартных регуляризаций, применяемых при обработке оптических изображений, при обучении нейросетей на датасетах из изображений, регистрируемых вне оптического спектра, показало общие тенденции с применением регуляризаций при обработке оптических изображений. Одна из тенденций заключается в том, что точность распознавания изображений в общем случае прямо пропорциональна глубине сети и до некоторого числа слоев обеспечивает быстрый рост вероятности правильного обнаружения. Однако дальнейшее увеличение количества слоев приводит к гораздо большему увеличению вычислительных затрат, чем к увеличению точности распознавания.

В некоторых случаях метод отключения случайных нейронов приводит к значительному снижению точности распознавания, а в других случаях – к увеличению точности. При этом в проведенных исследованиях максимальная вероятность правильного распознавания была достигнута при вероятности аугментации изображения на уровне выбора партии изображений, равной 0,2. 

Научно-исследовательская работа выполнялась при поддержке Российского фонда фундаментальных исследований и Правительства Ульяновской области. Результаты исследования были представлены на конференции по искусственному интеллекту OpenTalks AI, которая состоялась в Москве 3-5 февраля 2021 года.