21.12.2016 / 13:51

Пераможца мінскага AI Hackathon запускае нейронныя сеткі ў рэальным часе на любой платформе

48 гадзін, 45 каманд, 10 ментараў, прызы на суму $ 9000 — AI Hackathon, які прайшоў на выходных у ПВТ, увайшоў у лік найбуйнейшых профільных мерапрыемстваў года ў беларускіх ІТ. Падзея, арганізаваная прасторай Space і бізнэс-інкубатарам Парка высокіх тэхналогій пры падтрымцы венчурнага фонду Haxus і кампаніі servers.com, сабрала больш за 200 распрацоўшчыкаў і некалькі соцень гасцей.

Гурскі: «Самы моцны хакатон з усіх, на якіх пабываў»

Большасць выбраных камандамі задач была звязана з распазнаваннем малюнкаў. Нядзіўна: у гэтай галіне штучнага інтэлекту (ІІ) цалкам выразна вызначаны стандарты, даступныя гатовыя наборы дадзеных, распрацаваны бясплатныя інструменты, за кошт якіх распрацоўку прататыпа можна «абкласці» ў 48 гадзін.

Іншыя тэмы праектаў — апрацоўка натуральных моў, апрацоўка і генерацыя аўдыё.

У журы ўвайшло каля 20 прадстаўнікоў беларускай ІТ-індустрыі, сярод якіх партнёры фонду Haxus Аляксандр Чакан і Дзмітрый Гурскі, сузаснавальнік EPAM Леанід Лознер, CEO Belka Technologies Юра Мазанік, COO Masquerade Андрэй Янчурэвіч, CEO Splitmetrics Макс Камянкоў, CEO VibroBox Ігар Давыдаў — спецыялісты па дадзеных, нейронных сетках і машынным навучанні.

Кожны член журы ацаніў праекты па трох крытэрыях: прататып і яго прэзентацыя, перспектыўнасць ідэі, аб'ём работ, выкананых за хакатон. Па кожным з трох кірункаў выстаўлялася ад 1 да 3 балаў, сума якіх і стала вынікам.

Па словах Дзмітрыя Гурскага, тройка пераможцаў вызначылася адназначна, хоць некалькі наступных пазіцый адсталі ад прызёраў ўсяго на некалькі балаў — пры максімуме больш за 150.

З 45 каманд, сабраных на старце хакатона, у другі дзень працягнулі працу 35, да ўзроўню прататыпа дайшло каля 30. У паўфінале 19 з іх былі адабраны для завяршальных пітчаў і барацьбы за прызы. Дзмітрый Гурскі адзначыў, што асноўнай мэтай адсеву было скарачэнне часу на фінал:

— Агульны ўзровень праектаў вельмі моцны, ён значна перавысіў нашы чаканні. Гэта самы моцны хакатон з усіх, на якіх я быў, — і па складзе, і па выніку. Упэўнены, кожны праект, які прайшоў у топ-10, годна глядзеўся б на найбуйнейшых хакатонах у любых тэхналагічных цэнтрах. Многія распрацоўкі можна ператвараць у камерцыйныя, з многімі камандамі Haxus хацеў бы працягнуць зносіны пасля мерапрыемства.

Трэцяе месца: энергетычная каштоўнасць абеду па яго фатаграфіі

Тройку прызёраў замкнула аб'яднаная каманда RocketBody і A(3)Ri, якая сабралася на самым хакатоне. Створаны камандай прататып вызначае каларыйнасць ежы па яе фатаграфіі. За хакатон каманда паспела стварыць дзве мадэлі штучнага інтэлекту: першая ўмее распазнаваць на фотаздымках стравы, другая — разбіраць, колькі і якіх інгрэдыентаў змяшчаецца на сфатаграфаванай талерцы. Пры гэтым мадэль не проста здольная адрозніць мяса ад гародніны — яна спрабуе вызначыць ступень прасмажання, тлустасць ежы.

Каманда плануе выкарыстаць гатовыя мадэлі ў мабільным дадатку. Карыстальнік зможа ўнесці ў яго ўласныя антрапаметрычныя дадзеныя, на аснове якіх дадатак падлічыць для яго асабістую дзённую норму спажывання калорый. Паслядоўна здымаючы сваю ежу на працягу дня і загружаючы фатаграфіі ў дадатак, карыстальнік зможа бачыць, які «крэдыт калорый» застаўся ў яго да канца дня.

Каманда падкрэслівае, што не ставіць мэты рабіць дакладны разлік з мінімальнымі хібамі:

«Памыліцца на 100 кілакалорый — не праблема. Наша задача — прадбачыць значны перарасход, на 500—800 кілакалорый, і падказаць карыстальніку: «Ведаеш, сёння ў McDonalds лепш не ісці — павячэрай дома салатай і гарбатай».

Наступная мадэль, якая патрэбна для рэалізацыі гэтага функцыяналу, — прывязка порцый на фота да маркераў. Гэта дазволіць разлічваць памеры стравы, а, выкарыстоўваючы даступныя табліцы шчыльнасці, — і яго масу.

Дзмітрый Гурскі асабліва адзначыў камерцыйны патэнцыял праекта: «Мяркуючы па тым, якія экзіт адбываўся ў гэтай галіне ў апошнія два гады, гэта можа быць праект на сотні мільёнаў».

Другое месца: «карта пустазелля» для эканоміі ў сотні тысяч

За крок ад перамогі засталася каманда аграстартапа OneSoil, якую на хакатоне ўзмацніў цімлід Juno Арсень Краўчанка. Выкарыстоўваючы набор дадзеных, сабраны за тры гады палётаў на дронах над сельскагаспадарчымі ўгоддзямі, распрацоўшчыкі стварылі механізм распазнання пустазелля на капусных і рапсавых палях. Выкарыстоўваючы гэты механізм, каманда можа ствараць карту ўнясення хімікатаў на палі.

Як правіла, у сельскай гаспадарцы гербіцыдамі заліваецца ўсё поле. Паводле інфармацыі OneSoil, кошт апрацоўкі рапсавага поля плошчай 100 гектараў — каля $11 тысяч. Сучасная тэхніка, аднак, можа ўключаць фарсункі распылення кропкава, над пэўнымі шэрагамі. Каманда падлічыла агульную плошчу пустазелля на здымках з датасэта — аказалася, пры выкарыстанні «карты пустазелля» гаспадарка можа эканоміць да 75% хімікатаў.

У якасці тэарэтычнай асновы механізму распазнання OneSoil выкарыстоўвалі мадэль, апісаную ў артыкуле End-to-end People Detection in Crowded Scenes. Гэтая мадэль дазваляе адзначаць галовы на фотаздымках з вялікай колькасцю людзей. Выкарыстоўваючы падобную тапалогію, каманда змагла дасягнуць высокага F1 score: 0,9 для капусных палёў і больш за 0,8 для рапсавых. Нейронная сетка навучылася знаходзіць нават тыя пустазеллі, якія самі распрацоўшчыкі не знайшлі на фота падчас разметкі датасэта.

Акрамя прызоў за другое месца, каманда OneSoil атрымала падарунак ад юрыдычнай кампаніі «Алейнікаў і партнёры»: кнігу Насіма Талеба «Антыкрохкасць» і 50-працэнтную зніжку на паслугу «пакаванні» стартапа для венчурнага інвестара — поўнае афармленне неабходнай па беларускім заканадаўстве дакументацыі для асваення венчурных укладанняў.

Пераможца: нейронныя сеткі ў рэальным часе на любой платформе

Калі большасць каманд засяродзілася ў працы над прыкладнымі задачамі, то пераможца хакатона прапанаваў журы тэхналагічнае рашэнне. Праект mInference дазваляе прайграваць нейронныя сеткі на розных платформах з мінімальнымі часовымі затрымкамі. У якасці прататыпа каманда прэзентавала вэб-дадатак, які класіфікуе аб'екты на малюнку з вэб-камеры без падлучэння да сервера. Час водгуку нейроннай сеткі ў параўнанні з папулярным фрэймворкам Caffe зменшыўся ў некалькі разоў: з 12 секунд да 2.

Каманда mInference складалася ўсяго з двух чалавек: тэхнічнага спецыяліста Марата Духана і Анастасіі Крымскай, якая займалася прапрацоўкай магчымай манетызацыі і стварэннем прэзентацыі для дэма-праекта. У якасці асновы для праекта Марат выкарыстаў уласную бібліятэку NNPACK, напісаную ім падчас вучобы па праграме PhD у Тэхналагічным інстытуце Джорджыі. Высокая хуткасць працы нейроннай сеткі ў прататыпе — заслуга NNPACK.

Марат Духан

Марат пачаў займацца праектам mInference за два дні да хакатона — да мерапрыемства ён напісаў на Python набор модуляў для канвертавання мадэлі з фармату Caffe ва ўнутраныя класы. На працягу конкурсных 48 гадзін Духан рэалізаваў захаванне мадэлі ва ўласным бінарным фармаце, а таксама напісаў на мове C код для чытання гэтага фармату і прайгравання слаёў нейроннай сеткі.

Модуль нейрасеткі працуе ў браўзеры праз тэхналогію Portable Native Client: зыходны код кампілюецца ў байткод накшталт LLVM, а затым браўзер транслюе гэты байткод у рэальныя машынныя інструкцыі. mInference актыўна выкарыстоўвае высокую прадукцыйнасць Portable Native Client: у дэма-дадатку ужытыя шматструменнасць і SIMD-інструкцыі. Пакуль тэхналогія падтрымліваецца толькі ў Google Chrome, затое яна не патрабуе ўсталёўкі убудоў — карыстальніку дастаткова адкрыць вэб-старонку ў браўзеры.

mInference таксама можна перанесці на іншыя платформы за кошт простага перакампілявання. Абмяжавальны фактар — падтрымка платформы бібліятэкай NNPACK. Зараз у аўтара праекта гатовыя версіі бібліятэкі пад Linux, Mac, Portable Native Client і Android. У якасці наступнага кроку ў развіцці праекта Духан плануе запуск вэб-сайта з дэманстрацыяй тэхналогіі. Пасля нейрасеткі можна будзе запускаць і на прыладах IoT.

Перспектывы: AI-кластар і праекты-мільянеры

Галоўны грашовы прыз хакатона заснаваў фонд Haxus: пераможца атрымаў чэк на $ 2500, другое месца — $ 1500, трэцяе — $ 1000. Кампанія servers.com дадала да гэтых узнагарод сертыфікаты на хостынг: для першага месца — на суму $2000, для двух прызёраў — на $1200 і $700.

Прадстаўнікі Haxus паабяцалі, што AI Hackathon — не апошняе іх мерапрыемства ў тэме штучнага інтэлекту. Па словах Дзмітрыя Гурскага, задача фонду — стварыць кластар па задачах ІІ, які мог бы выпусціць не менш за 10—15 праектаў узроўню AIMatter і Flo. Гурскі адзначыў, што Haxus гатовы ствараць каманды з нуля і даваць ім уласныя задачы: «З умовай, што да нас прыйдуць выключныя людзі».

Дзмітрый Гурскі

У якасці дадатковай матывацыі для стартапаў партнёр фонду прывёў статыстыку заробкаў у папярэдніх праектах: «У практыцы фонду — пакідаць значныя долі ва ўласнасці стартапаў і перадаваць на каманду вялікія пакеты апцыёны. Ужо 17 чалавек, якія працавалі з намі, сталі мільянерамі, яшчэ некалькі дзясяткаў — купілі кватэры на кампенсацыі апцыёну па нашых экзітах. Калі ў вас ёсць добрая ідэя або вы ўпэўненыя ў сабе як у выключным спецыялісце — мы чакаем вашага ліста».