Кафедра анализа данных и машинного обучения Факультета информационных технологий и анализа больших данных

Петросов Давид Арегович

Ведущий научный сотрудник

​​​​​​​​​​​​​​​​Подведены итоги Всероссийского чемпионата Финуниверситета по машинному обучению.

​​​​Чемпионат Финансового университета по машинному обучению​​

​С 22 апреля по 23 мая 2018 года на платформе kaggle – ведущей мировой ​онлайн-площадке для​ соревнований по анализу данных – ​проходил Всероссийский чемпионат Финуниверситета по машинному обучению.

Участ​ники Чемпионата решали две задачи, предложенные крупнейшей страховой компанией России – СПАО «Ингосстрах»:

​В Чемпионате участвовали студенты Финансового университета, МГУ имени М.В. Ломоносова, Казанского федерального университета, Башкирского госуниверситета, МФТИ, МАИ, НИУ ВШЭ, РЭУ имени Г.В.Плеханова и СПбГЭУ. 

Почти половина участников – студенты первого курса магистратуры, еще 27% учатся на третьем курсе бакалавриата, среди участников есть и первокурсники, и второкурсники, и аспиранты. Кроме того, вне конкурса в соревнованиях принимали участие специалисты, не являющиеся студентами.​ 

Самый большой опыт спортивного анализа данных – у Константина Котика​ с физического факультета МГУ. Он участвовал уже в 15 соревнованиях, в том числе в составе команды DecisionGuys занял 10-е место на Toxic Comment Classification Challenge.

​Чемпионат проходил в очень активном режиме. Всего на kaggle было загружено 7​06 решений первой задачи и 690 решений второй задачи. Как обычно в подобных чемпионатах, лидеры образовали плотную группу, различия между качеством их решений измеряются десятыми долями процента, а в последние шесть часов лидеры несколько раз менялись местами​.

Лучшее решение первого задания представил студент магистратуры Финансового университета Юрий Кузьмин. Он представил первый вариант решения 1 ​мая и постоянно улучшал его, всего загрузив 108 решений, последнее из которых, показавшее наилучшее значение метрики MAPE, – ​за шесть минут до завершения Чемпионата, 23 мая в 23.54.

Лучшее решение второго задания предложил студент бакалавриата Финуниверситета Роман Матиив (с 27 апреля по 23 мая Роман залил на kaggle 20 решений, лучшим по показателю AUC оказалось решение, предложенное 21 мая).

По итогам двух соревнований первые три места заняли студенты Финансового университета:
  1. Юрий Кузьмин (первый курс магистратуры, программа «Анализ больших данных и машинное обучение в экономике и финансах»).​ ​
  2. Роман Матиив (третий курс бакалавриата, программа «Анализ данных и принятие решений в экономике и финансах»). 
  3. Ирина Козлова (первый курс магистратуры, программа «Анализ больших данных и машинное обучение в экономике и финансах»)​.
Среди призеров:
  • Александр Косов (третий курс бакалавриата факультета инноваций и высоких технологий МФТИ) ​ четвертое место;
  • Константин Котик (первый курс магистратуры физического факультета МГУ имени М.В. Ломоносова) ​ пятое место;
  • Марина Шадричева (первый курс магистратуры СПбГЭУ) ​ седьмое место;
  • Давид Григорян (первый курс школы бизнес-информатики НИУ ВШЭ) восьмое место;
  • Дмитрий Борисов (первый курс магистратуры ф​​акультета инноваций и высоких технологий МФТИ) ​ десятое место.

На шестом и девятом местах Дмитрий Паршин и Анна Чумаченко, которые участвовали в Чемпионате вне конкурса, не являясь студентами.

Поздравляем победителей и призеров, приглашаем всех участников на награждение!

Обсуждение задач, награждение победителей и участников состоится 4 июня 2018 года в 18.00 по адресу: Москва, Щербаковская улица, 38​​.

​Финальная таблица лидеров по итогам двух соревнований


УчастникВуз
Место
в 1-м сорев-
новании
(m1)
Метрика качества (MAPE)Число загру​​-
жен-
ных реше-
ний
Место
во 2-м сорев-

новании
(m2)
Метрика качества (AUC)Число загру-
жен-
ных реше-​
ний
Итого-
вая
оцен​к​а
(M)
​Место
в
Чемпи-
онате
Юрий
Кузьмин
(Lugark)
Финунивер-ситет
17,9257110670.76297660,02912535
1
Роман
Матиив
(matiiv)
Финунивер-ситет
248,907233410.76709190,025458622
Ирина
Козлова
(Kozlova)
Финунивер-ситет
27,9958413460.76368700,01688555
3
Александр
Косов
(Alexander
Kosov)
МФТИ
68,216883320.7657480,01646863
4
Константин
Котик
(Konstantin
Kotik)
МГУ
38,03777940.7639070,01464457
5
Дмитрий
Паршин
299,28168630.7644980,00901426
6
Марина
Шадричева
(Marina
Shadricheva)
СПбГЭУ
48,138405130.7245630,00828643
7
Давид
Григорян
(David-Grigoryan)
ВШЭ
88,286851680.76145150,00625391
8
Анна
Чумаченко
(Anna
Chumachenko)

58,187287350.6352620,00582507
9
Дмитрий
Борисов
МФТИ
309,281681450.76382220,00573275​
10​
​  

Общее количество участников, подавших решения в первом соревновании, составило n1 = 39 человек, а общее количество участников, подавших решения во втором соревновании, составило n2 = 41 ​человек.

Если некоторый участник занял место m1 в пе​​рвом соревн​овании и место m2 во втором соревновании, то итоговая оценка данного участника (M) определялась по формуле​

M​​ = 1/(n1m1) + 1/(n2m2).

​Далее участники ранжировались по убыванию M​ (первое место в Чемпионате занял участник с наибольшим значением M).