Большая часть документов – метрические записи о важных событиях в жизни конкретных людей, включая крещение или заключение брака. На сегодня доступны сканы 550 тысяч рукописных листов, предоставленных якутским архивом. Это около 3000 дел, каждое из которых содержит метрическую книгу одной и более церквей за год или несколько лет.
Это поможет пользователям найти информацию о предках из Якутии, а исследователям — узнать больше о людях, которые в разное время жили в нашей республике. Для работы с метрическими книгами сервис использует нейросети: они считывают старые рукописи и преобразуют их в печатный текст. Как проинформировали в Яндексе, Якутия не первый регион России, с которым работает «Поиск по архивам», — всего их уже 20. Например, это Москва, Московская, Омская и Оренбургская области, а также Чувашия. Каждый месяц сервис пополняет свою базу новыми историческими документами из разных регионов нашей страны. «Поиск по архивам» запущен в начале 2023 года, он помогает быстро находить упоминания людей, населённых пунктов и событий в расшифрованных нейросетью рукописных документах XVIII–XX веков.
В базе сервиса представлено более 16 миллионов страниц исторических документов из архивов Москвы, Московской, Оренбургской, Вологодской, Астраханской и других областей, а также нескольких муниципальных архивов. Кроме того, в сервисе можно искать информацию в архивах епархиальных ведомостей, дореволюционного «Коммерсанта», «Русского инвалида», «Советского спорта», «Вечерней Москвы», «Сенатских ведомостей», «Дагестанской правды» и «Красной звезды», а также в справочниках из фондов Национальной электронной библиотеки и Российской государственной библиотеки.
Для оцифровки исторических документов сервис использует технологию, основанную на оптическом распознавании символов. Нейросеть узнаёт неактуальные знаки — например, исчезнувшие из алфавита буквы, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в понятный печатный текст.