Ускоряем исследования с помощью конкурсов / Иван Гуз, Михаил Трофимов (Avito)

513
28.5
Онтико84.4 тыс
Опубликовано 7 апреля 2017, 19:25
Приглашаем на конференцию HighLoad++ 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке: clck.ru/3DD4yb
--------
HighLoad++ 2015

Презентация и тезисы:
highload.ru/2015/abstracts/186...

Задачи машинного обучения (ML) имеют несколько другую специфику, нежели инженерные задачи построения высоконагруженных систем.

Многие из ML-задач можно решить быстро и "на коленке". Хрестоматийный пример - хотим построить спам-фильтр и берем наивного байеса. Хороший масштабируемый алгоритм, но на реальных данных оказывается, что качество низкое. Возникает вопрос - что делать? Сдаваться и давать волю спамерам или перепробовать миллион модных современных методов текстовой аналитики за бесконечное время?
...
жизньигрыфильмывесельеавтотехномузыкаспортедаденьгистройкаохотаогородзнанияздоровьекреативдетское