В сервисе «Поиск по архивам» открыт доступ к почти пяти миллионам страниц метрических книг, ревизских сказок и исповедных ведомостей с середины XVIII века до 1919 года. Новый алгоритм построен на основе системы оптического распознавания символов, он учитывает особенности почерка, узнаёт буквы дореформенного алфавита и понимает особую структуру архивных документов. Помимо документов Главархива для обучения сервиса использовали также десятки миллионов сгенерированных примеров.
«В Главархиве сохранился один из самых значительных по объему комплексов метрических книг — их около восемнадцати тысяч, — рассказали “Стимулу” в архивном ведомстве. — Это книги церквей Москвы и Московской губернии, чьи границы отличалисьот современной Московской области. В архиве можно найти метрики не только столичных храмов, но также сельских церквей и церквей уездных городов Московской губернии. Кроме того, в архиве хранится небольшое количество книг храмов населенных пунктов, вошедших в советское время в состав Московской области. Это Каширский уезд Тульской губернии, Зарайский и Егорьевский уезды Рязанской, Покровский и Александровский уезды Владимирской губернии».
Сервис «Поиск по архивам» пополнили также документы из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться. Необходимые сведения можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями «Яндекса». Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.