Представьте, что вы историк или антрополог, или просто интересуетесь местом, где живете, или ищете информацию о родственниках. Сейчас доступ к историческим источникам, материалам и архивам в основном достаточно трудоемок. Нужно заказывать литературу, приезжать, например, в библиотеку, и читать все на месте. Это усложняет и замедляет работу исследователя.
В 2021 году сотрудники Научной библиотеки Томского государственного университета (ТГУ) организовали проект по сбору письменных материалов о Сибири. Так появилась платформа
«PRO Сибирь» — все документы в одном цифровом месте.
В самом начале в распоряжении ученых было 200 тысяч выпусков сибирских газет, 2660 названий книг, 580 рукописей, 275 изоматериалов и 1675 тетрадей из экспедиций филологов — все это было необходимо разместить на портале. Количество источников постоянно пополнялось за счет новых оцифрованных документов и на помощь пришли волонтеры: люди науки приняли участие в проекте
«Сибирские газеты». От участников требовались умение работать с Excel-таблицами, доступ в Интернет, время и желание.
«До этого мы не имели опыта привлечения волонтеров к научной деятельности, — рассказывает куратор проекта, Андрей Пархоменко, в
интервью для издания «Такие дела». — Сегодня к нам приходят и школьники, и студенты, и работающие люди. Их всех объединяет интерес к старинным источникам и желание помочь нам».
Также Андрей отметил, что создателей «PRO Сибирь» вдохновлял пример национальной библиотеки Австралии Trove. Там волонтеры распознали и внесли в базу десятки тысяч документов.
Сейчас проект «Сибирские газеты» завершен, но совсем недавно он получил продолжение. Теперь, когда основные материалы размещены на платформе, ученым нужна помощь в оцифровке архива газет с 1857 до 2000 годов.
«Полтора века сибирских газет» — новый проект на портале «Люди науки». У платформы «PRO Сибирь» появился новый функционал — автоматическое распознавание текстов. Однако в газетах разных лет особая верстка и большое разнообразие шрифтов, которые машина может не увидеть, поэтому нужна помощь волонтеров.
Все довольно просто: на экране слева высвечивается газета, а справа — текст, уже распознанный машиной. Задача волонтера — поочередно расшифровывать колонки с записями в газетах и перепечатывать текст в распознанную часть. В описании проекта можно найти инструкцию по работе с платформой.
Чем качественнее оцифрованы источники, тем лучше они индексируются поисковыми инструментами. Поможем оцифровать источники о Сибири, люди науки? Пусть каждый сможет найти информацию о месте, где живет, происходивших событиях, и самое важное — о своих родственниках.