«Яндекс» научил нейросети расшифровывать документы с дореволюционной орфографией
«Яндекс» обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, передает РИА «Новости» со ссылкой на представителей компании.
Новый алгоритм построен на основе системы оптического распознавания символов. Он учитывает особенности почерка, узнает буквы, утратившие свою актуальность, а также понимает особую структуру архивных документов. Специалисты обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков.
«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд», – рассказала руководитель «Поиска» Елена Бубнова.
Ранее сообщалось, что Google хочет покончить с проблемой плохого почерка медиков. Американская компания планирует интегрировать функцию перевода каракулей врачей в текст.