Подпишитесь, чтобы быть в курсе

Главная > Статьи > Архивное дело > Общество > Исследователи читальных залов: готовность к новым технологиям и краудсорсингу

Исследователи читальных залов: готовность к новым технологиям и краудсорсингу

Прочитать позже   Отправить по e-mail

Следуя государственной программе информатизации общества, архивы форсируют создание собственных информационных систем и их наполнение контентом на основе электронных копий НСА и архивных документов. Как пример внедрения цифровых практик в свою работу можно выделить Государственный архив Тульской области (ГУ ГАТО). Предлагаем нашим читателям результаты исследования, проведенного тульскими архивистами с целью изучения пользовательской аудитории архивных информационных ресурсов и вопроса готовности читателей к самостоятельной работе с ними.

Антонова.jpg
И.А. Антонова
начальник отдела научно-исследовательской работы ГУ ГАТО,
канд. ист. наук
Осознание неизбежности применения цифровых технологий во всех направлениях общественной деятельности произошло в России более двух десятилетий назад. В 1990-е годы очень важную роль во внедрении инноваций в профессиональное сознание архивистов сыграла ассоциация «История и компьютер», ее знаменитые научные конференции и «осенние школы» при историческом факультете МГУ под руководством Л. И. Бородкина и И. М. Гарсковой, участниками которых были также тульские архивисты. В архивной отрасли основы данного подхода были заложены Концепцией информатизации, разработанной в 1995 году. В настоящее время архивная отрасль руководствуется Программой информатизации Федерального архивного агентства и подведомственных ему учреждений на 2011–2020 гг.[1]  . Государственный архив Тульской области (ГУ ГАТО) с 2002 года также работает на основе собственных программ развития данного направления, беря за основу среднесрочные периоды в 3-5 лет.

В ГУ ГАТО внедрение информатизации началось с появлением в 1992 г. отдела автоматизированных архивных технологий (ААТ). После перевода систематического каталога на электронный носитель, архив с 2001 г. шел по пути создания в Access баз данных описей и источникоориентированных информационных ресурсов (решения органов власти, ревизские сказки, клировые ведомости, переписи населения и др.). По состоянию на 2016 год имелось уже 167 тематических БД общим объемом 3,1 Гб, которые были доступны только для сотрудников. Несколькими годами ранее пришло осознание необходимости их интеграции, но в Access это было неосуществимо. Цифровой контент архива включает также документы и описи. Их оцифрование осуществляется собственными силами отдела микрофильмирования на двух планетарных сканерах и составляет в настоящее время 4 ТБ. В 2015 году по проекту с генеалогическим обществом Солт-Лейк-Сити (штат Юта, США) архив получил электронный фонд пользования объемом 50 ТБ. Таким образом, ГУ ГАТО наработал значительные объемы информации на электронном носителе, которые могли быть предоставлены пользователям в режиме удаленного доступа.

Однако когда речь идет об использовании индексированных информационных ресурсов, создававшихся архивистами на протяжении многих лет, мы полагаем, что доступ к ним должен быть платным. По этой причине требовалось также разработать необходимый инструмент, обеспечивающий оплату в режиме удаленного доступа. Предоставление индексированных информационных ресурсов за плату одобрено Руководителем ФАА А. Н. Артизовым в докладе «О стратегических подходах к размещению архивной информации в сети Интернет» на заседании Совета по архивному делу (8 октября 2014 г., г. Санкт-Петербург).

Заключение в 2015 году договора с ООО «Альт-Софт» (Санкт-Петербург) и начало внедрения программно-информационного комплекса «КАИСА-архив», способного одновременно осуществить интеграцию информационных ресурсов, веб-представление цифрового контента и оплату в режиме удаленного доступа, заставило также задуматься об изучении вопроса готовности другой стороны – исследователей – к самостоятельной работе с ним. В данном контексте большое значение имел доклад А. Н. Артизова «О стратегических подходах к размещению архивной информации в сети Интернет». В нем, в частности, говорилось о целесообразности осуществить комплекс научно-исследовательских работ по изучению отечественной пользовательской аудитории архивных информационных ресурсов, т.к. известна зарубежная статистика, а в отечественной историографии данный вопрос не нашел должного освещения. Кроме того, именно исследователи являются потенциальными участниками краудсорсинга. В этих целях была разработана анкета из 30 вопросов «Обслуживание пользователей читальных залов ГУ ГАТО в информационной среде». Анкетирование проведено в августе 2015 г.; получено 52 ответа посетителей читального зала, из них 1 исследователь откликнулся на объявление, размещенное на сайте.

Прежде всего, дадим характеристику респондентам. Одной из отличительных черт является высокий образовательный уровень: 82,4% – люди с высшим образованием, из них 9 человек (21,4%) имеют научную степень: 8 кандидатов и 1 доктор исторических наук. Большинство респондентов – гуманитарии (76,5%).


Для 71,4% работа в читальном зале не связана с профессиональной деятельностью, цель – исследовательская и хобби (в этих разделах группируются те, кто занимается родословными, что составляет до 65 %); затем следуют научная, публикаторская и коммерческая цели.


В режиме удаленного доступа более всего заинтересованы посетители из других областей (26%) и городов Тульской области (20%), составляющие почти половину исследователей.

Возраст является еще одной отличительной особенностью: 46,2% респондентов – люди старше 50-ти лет. Они не всегда готовы самостоятельно работать в современном цифровом пространстве, поэтому несколько вопросов анкеты были предусмотрены, чтобы оценить степень владения необходимыми навыками. 41 респондент ответил, что умеет работать через личный кабинет; половина может оплатить услуги через интернет и отредактировать оцифрованное изображение.

Всеми основными офисными программами владеют 14% респондентов. Увереннее всего они работают с Word (38%), и лишь 12% готовы работать с БД Access. 11% не дали никакого ответа, что заставляет предполагать незнание данных программ. Недостаточное владение респондентами Аccess проявилось также в выборе форматов описей для размещения на сайте: 42% хотели бы работать в Word, 40% – с оцифрованным изображением, и только 16% – с БД описи.


Данное обстоятельство делает затруднительным переход на работу читального зала в полностью автоматизированном режиме. Внедрение в эксплуатацию с 2017 года ПИК «КАИСА-архив» показало, что 20–25 % посетителей читального зала самостоятельно не справляются с заполнением требований и заказов, за них эту работу выполняют сотрудники.

На вопрос о потребности в копиях документов (при их бесплатном предоставлении) ответили 30 человек. Среднестатистический исследователь хотел бы копировать 190 кадров в год. Реально запрашивалось, конечно, значительно меньше – приблизительно 25 кадров на посетителя. За три квартала 2015 года для 97-ми исследователей (149 заказов) в ГУ ГАТО изготовлено 2277 кадров на сумму 133 тыс. руб. За весь 2016 год архив оказал платные услуги по оцифрованию документов для пользователей на сумму 218,8 тыс. руб. (в объеме 1950 кадров). После разрешения копирования собственными техническими средствами, с 16.09.2016 по 31.05.2017 (практически за те же 9 мес., без учета платных заказов) исследователям читального зала самостоятельно сделано ок. 6700 кадров дел АФ, что заметно снизило внебюджетные доходы архива. Отметим, что данный объем можно также рассматривать как потенциал для применения краудсорсинга.

Архивисты строят работу, зная все достоинства и новые возможности документов на электронном носителе, полагая, что исследователи уже предпочитают работать с оцифрованными документами. Однако для регионального архива это скорее перспектива, нежели современные реалии. 70% респондентов предпочитали работать с оригиналами описей и документов; для 12,5 % носитель не имел значения. Интересен ответ на вопрос почему. Исследователи предпочитают оригиналы из-за: привычки, удобства, даже любви («люблю подлинники»), спокойствия, скорости изучения, из соображений сохранения зрения (имеется в виду отрицательное воздействие мерцания экрана), не всегда удовлетворительного качества оцифровки (утрата части информации на сгибах и по краям), возможности визуального сравнения данных нескольких дел одновременно или «объемного мышления».

Поскольку руководители регионов ставят перед архивами задачу изыскания возможностей зарабатывать самостоятельно, данному сюжету была также посвящена группа вопросов анкеты. Учитывая, что многие исследователи не умеют самостоятельно осуществлять поиск по индексированным архивным ресурсам, был задан вопрос, готовы ли они платить за оказание подобной услуги. Половина готова платить только за копии документов; 2 человека выбрали все услуги; ни за что не желают платить 5 чел., за фрагменты описей по теме исследования заплатили бы 5 чел. и за тематические выборки из систематического каталога (с архивными шифрами) – 2 человека.

В определенной степени удивили ответы на вопрос о готовности оказать материальную поддержку для разработки НСА, нужного респонденту. Положительно ответили 17 человек (32,7 %)! Видимо, в целом платежеспособность посетителей читального зала достаточно высока, и известные всем архивистам разговоры о низком материальном уровне не вполне оправданы.

Зная об успешности зарубежного опыта применения технологии краудсорсинга, в анкету был включен вопрос о готовности участвовать в безвозмездной разработке поисковых информационных ресурсов. Положительно ответили 24 человека (почти половина): 14 респондентов согласны посвятить этому 3 дня, 9 чел. – 10 дней и 1 чел. – 30 дней. Полученный результат позволяет сделать вывод о том, что применение краудсорсинга в региональных архивах является неиспользованным резервом и имеет реальную основу для его применения.

Поскольку считается, что краудсорсинг появился в 2006 г., имеет смысл уточнить содержание термина. По одному из определений он представляет «инновацию пользователя», при которой пользователь выступает не только как потребитель, но и как участник процесса формирования новых технических качеств, причем на безвозмездной основе. Исходя из данного определения, признаки краудсорсинга можно найти значительно ранее даты появления термина. Например, во Франции в 1960-х годах наблюдался бум интереса к генеалогии, в результате чего поток исследователей захлестнул архивы. Они были вынуждены привлечь к составлению родословных общества генеалогов-любителей. В целях ускорения поиска последние самостоятельно разрабатывали справочный аппарат, создавая именные картотеки к различным фондам и размещая их в читальных залах архивов для общего пользования. В современном варианте речь шла бы, конечно, о применении компьютерных технологий и размещении информации на сайте.

А. Коробова, посвятившая статью применению краудсорсинга в архивном деле, выделяет три направления – обсуждение совершенствования работы архивных учреждений, привлечение «толпы» к оцифровке архивов, «открытые данные»[2] .

ГУ ГАТО имеет небольшой опыт фрагментарного использования краудсорсинга. Так, исследователи принимали участие в усовершенствовании ф. № 1770 «Коломенская духовная консистория» (составление заголовков дел), создании именного указателя к родословной книге дворянства Тульской губернии; в 2016 году в целях получения обратной связи с исследователями был проведен круглый стол «Автоматизированный НСА ГУ ГАТО».

В 2015 г. исследователь А. В. Шераутин, индивидуальный предприниматель в г. Туле, по собственной инициативе написал программу конвертации оцифрованных образов метрических книг, полученных в рамках проекта с генеалогическим обществом Солт-Лейк-Сити, из формата tif в формат jp2. Это позволило сжать 50 ТБ контента до 3 ТБ без потери качества, разместить на имеющемся оборудовании ГУ ГАТО и начать использование при помощи простой поисковой системы. Юридически отношения между архивом и исследователем оформлены договором о сотрудничестве на безвозмездной основе, хотя стоимость выполненных работ могла достигать 400 тыс. руб. В знак благодарности ему бесплатно были предоставлены образы документов, нужные для составления родословной. Данная программа позволила также оптимизировать работу ПИК «КАИСА-архив», в которую в настоящее время влиты оцифрованные образы источников генеалогической информации.

Мы говорили о примерах, если можно так выразиться, «стихийного» краудсорсинга или его единичных проявлений. Однако технология характеризуется именно массовым участием волонтеров в процессе выполнения в режиме он-лайн архивных видов работ не сложных, но требующих времени в силу своей объемности. Ими могут быть:

  • создание базы данных «Именные указатели»; 
  • создание индексированных поисковых ресурсов (ввод заголовков машинописных или рукописных описей в базу данных описи);  
  • верификация распознанных текстов (напр., описей); 
  • аннотирование фотодокументов (идентификация изображенных людей); 
  • оцифрование архивных документов.

Наиболее оптимально было бы прямое вливание полученных результатов в генеральный электронный каталог. Однако данный подход сложно реализовать по нескольким причинам. Главная из них – в Туле введен в эксплуатацию ПИК «КАИСА-архив», с помощью которого удалось успешно решить задачи интеграции разрозненных информационных ресурсов и их представления в Интернете. Работа по наполнению системы возможна только при наличии АРМа (стоимость – ок. 60 тыс. руб.), выделенных сетей и лицензионного программного обеспечения, что не может быть предоставлено для использования он-лайн или приобретено волонтерами за свой счет. Ресурс, созданный архивистами в соответствии с нормативными документами отрасли, не должен подвергаться риску информационного искажения или даже уничтожения сторонними пользователями, т.к. это весьма дорогостоящий продукт.

В Туле работа с индексированными описями, систематическим каталогом и оцифрованными образами документов, включенными в генеральный электронный каталог, осуществляется на платной основе, а продукт краудсорсинга по своей сути может быть только бесплатным. Выход для ГУ ГАТО (в отличие от архивных учреждений, предоставляющих весь цифровой контент бесплатно) возможен лишь в создании второго поискового ресурса, размещенного на сайте архива, что противоречит идее генерального каталога, информационный потенциал которого выше, чем сумма отдельных частей.

Очень заманчиво попытаться использовать оцифрованные образы документов, которые, как было отмечено выше, в достаточно больших количествах начали самостоятельно изготавливать исследователи читальных залов. Однако здесь также есть проблемные моменты: оцифрование осуществляется без соблюдения требований к качеству снимков – для собственных нужд, разнородной техникой – чаще всего с телефона, без именования файлов в соответствии с архивным шифром, копии являются отдельными листами дела. Этот неупорядоченный массив не может быть использован без серьезного редактирования и доработки архивистами; проще все делать профессионально.

Несмотря на выражение готовности поработать бесплатно, исследователи, тем не менее, ждут для себя вознаграждения в форме нарушений правил работы архива или читального зала: выдачи оригиналов при наличии фонда пользования, увеличения количества дел одноразового заказа, приоритета в исполнении их заказов, бесплатного предоставления копий документов (сделанных на качественном оборудовании архива), и даже разрешения работать в архивохранилище.

Итоги анкетирования в ГУ ГАТО выявили наличие относительно высокой заинтересованности исследователей, их готовность безвозмездно вкладывать свой труд. Внедрение краудсорсинга позволит быстрее обработать большие объемы информации за счет дополнительной рабочей силы, привлечет внимание к архивам, их значимости, будет способствовать повышению среди пользователей уровня практического владения информационными технологиями. Идея применения краудсорсинга как неиспользованного резерва архивной отрасли, безусловно, должна найти дополнительное осмысление в каждом архиве. В настоящее время наиболее приемлемой и поддающейся организации формой является архивная практики студентов.

Скачать презентацию.

Скачать анкету.

Примечания:

1. Утверждена письмом Минкомсвязи России от 10 октября 2011 г. № ИМ-П8-17455..

2. Коробова, Анна. Трансформация электронных архивов документов и данных на основе краудсорсинга. [Электронный ресурс]. URL: http://gosbook.ru/node/65990 (дата обращения: 18.05.2017).


И.А. Антонова,
начальник отдела научно-исследовательской работы ГУ ГАТО,
 к.и.н
Полезная статья?
Да / Нет
Прочитать позже В избранное Отправить по e-mail
  • Поделиться в соцсетях:
Только зарегистрированные участники могут оставлять комментарии. Авторизуйтесь или зарегистрируйтесь

Материалы по теме:



Семинары

Все семинары

Сервисы

Все сервисы

Ваши идеи

Знаете как сделать портал лучше? Поделитесь идеей.

Информационный портал НААР создан сообществом экспертов архивной отрасли РФ. Целью портала является сбор и обобщение, а также анализ всей информации, размещенной в Интернете и в других источниках, имеющей отношение к документам.
На сайте размещены свежие новости и пресс-релизы архивных компаний России, СНГ и зарубежья.

© 2016 - архивный портал naar.ru