Александр Пиперски: "Сложности при обработке естественного языка."

6 886
14.6
Опубликовано 31 октября 2017, 12:32
Вторая лекция курса "Компьютерная лингвистика (arhe.msk.ru/?page_id=22540) состоялась 18 октября 2017 года.

На втором занятии продолжили обсуждать, какие сложности представляет естественный язык для обработки: от омонимии, про которую говорилось на первом занятии (т. е. случаев, когда одно и то же слово значит разные вещи), мы перейдём к синонимии — ситуации, когда, наоборот, один и тот же объект обозначается разными словами («президент США», «Дональд Трамп», «американский лидер»). Во второй части занятия мы изучим самый распространённый инструмент для поиска шаблонов в строках — регулярные выражения, научимся выделять в тексте e-mail’ы и телефоны и поймём, как это поможет нам делить текст на слова.

Лектор: Пиперски Александр Чедович - кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ, автор книги "Конструирование языков".

Поддержать проект: donatepay.ru/don/arhe
"Архэ" в ВК: vk.com/kpc_arhe
"Архэ" на ФБ: facebook.com/arhecenter
"Архэ" в Instagram: instagram.com/arhe_center
Второй канал центра "Архэ": youtube.com/channel/UC-NKMsmOd...

Все вопросы относительно посещения лекций, просмотров трансляций или покупки видео можно задать по почте: arhe.msk@gmail.com
жизньигрыфильмывесельеавтотехномузыкаспортедаденьгистройкаохотаогородзнанияздоровьекреативдетское