TopRater com: Машинное понимание миллионов отзывов / Павел Велихов (TopRater)

353
29.4
Онтико84.4 тыс
Опубликовано 7 апреля 2017, 19:00
Приглашаем на конференцию HighLoad++ 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке: clck.ru/3DD4yb
--------
HighLoad++ 2015

Презентация и тезисы:
highload.ru/2015/abstracts/183...

Мы строим сервис TopRater.com, который должен агрегировать в себе все мнения из Интернета относительно массы объектов e-commerce. Для этого мы "прочитали" миллионы отзывов и научились выделять из них сущности, аспекты, тональности и факты. При этом, хотя объемы данных кажутся маленькими для специалистов Big Data (всего несколько терабайт) - почти во всех задачах нам пришлось использовать технологии Big Data - сотни серверов на Google Cloud, Apache Spark, MPP Базы данных.
...
жизньигрыфильмывесельеавтотехномузыкаспортедаденьгистройкаохотаогородзнанияздоровьекреативдетское