Как нейросеть научили читать тексты XVII века

367 475
472.9
Яндекс408 тыс
Опубликовано 22 мая 2024, 9:00
Рукописи, может быть, и не горят, но точно ветшают и портятся. Понять, что написано в двухсотлетних документах, бывает непросто — и из-за их состояния, и из-за особенностей языка. Но на помощь приходят нейросети.

В прошлом году Яндекс запустил «Поиск по архивам». Это сервис, который помогает людям искать упоминания своих предков в архивных документах так же, как в интернете. Для этого команда обучила модель читать старинные тексты, и она уже распознала миллионы страниц.

👀 Попробуйте найти в архивах корни своей семьи: yandex.ru/archive

Это рубрика «Вопрос со звёздочкой», в которой разработчики Яндекса простым языком объясняют сложные технологии. Татьяна Сапатова занимается распознаванием текста в Яндексе и, в частности, в «Поиске по архивам». В «Вопросе со звёздочкой» она рассказывает об особенностях дореформенной орфографии и поиске по старинным записям, которые раньше могли читать только эксперты.

#поискпоархивам #технологии #нейросети #it #яндекс #генеалогия
тайм-коды:

00:00 — Что такое «Поиск по архивам»
00:46 — Огонь, вода, титло и другие сложности распознавания
01:39 — Как эксперты учили нейросеть читать
02:37 — Как модель находила слова в узорах
03:22 — Планы на будущее
жизньигрыфильмывесельеавтотехномузыкаспортедаденьгистройкаохотаогородзнанияздоровьекреативдетское