Новости

Яндекс представил новый сервис для расшифровки исторических документов

Яндекс представил новый сервис «Поиск по архивам» для расшифровки исторических записей с дореволюционной орфографией. Благодаря специально обученной нейросети старинные рукописи мгновенно преобразуются в печатный текст.

В базе сервиса насчитывается свыше 2,5 млн страниц исторических документов с текстовой расшифровкой. Документы можно искать по каталогам или через строку поиска. Также можно настроить фильтры по годам, фондам, архивам и описям.

Алгоритм, построенный на основе системы оптического распознавания символов, учитывает несколько параметров:

  • особенности почерка,
  • распознает утратившие актуальность буквы,
  • понимает структуру архивных документов.

Специалисты Яндекса обучали нейросеть на массиве данных из сотен тысяч рукописных строк из текстов XVII–XIX веков. В дальнейшем количество доступных отсканированных файлов и хранилищ будет увеличиваться.

Напомним, что Яндекс заблокировал более 151 тысячи аккаунтов рекламодателей в 2022.

Источник

Теги

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть
Закрыть