«Яндекс» представил поиск по дореволюционным архивым
Нейросети «Яндекса» научились расшифровывать архивные рукописные документы. В компании отмечают, что алгоритм оптического распознавания символов опирается на особенности почерка, вышедшие из употребления буквы, а ещё имеет представление о структуре архивных записей.
Уже сейчас в архиве имеется более 2,5 миллионов расшифрованных страниц текстовых документов. Имеется детальный поиск.
Обучение нейросетей происходило на основе базы данных из сотен тысяч рукописных строк из текстов XVII–XIX веков под руководством профессионалов.
Первым фондом, представленным в сервисе, стал Главархив Москвы — по его материалам и обучалась нейросеть. Также в базе есть документы Оренбургской и Новгородской областей. Этот перечень планируется пополнять.
В конце декабря прошлого года ИА SM-News писало, что колонки от «Яндекса» теперь могут найти смартфон.