Прочитать позже Отправить по e-mail
Чтобы спасти содержимое ирландского интернет-сегмента, руководство нацбиблиотеки предложило провести обширный захват (crawl) по всем адресам, зарегистрированным в Ирландии. Он позволит понять, что представляет собой «ирланднет» по состоянию на текущий год.
По своей природе веб-контент эфемерен, говорят эксперты. Сайты появляются и исчезают, дополняются и радикально изменяются. И несмотря на активное развитие технологий, риски утери важной информации по-прежнему высоки. Один из основателей интернета (создатель протокола передачи данных TCP/IP) и вице-президент Google Винтон Серф во время своего визита в Дублин в очередной раз напомнил об угрозе «темной цифровой эпохи» (digital dark age), которая может наступить в результате неудавшейся попытки сохранить цифровой контент.
Главная цель новой программы Национальной библиотеки Ирландии – не допустить разрастания черных дыр в цифровой вселенной. Для сохранения цифрового наследия ирландцы намерены архивировать все содержимое веб-сайтов, а не осуществлять захват некоторых страниц, как это нередко происходит при сканировании веб-данных (crawling).
Важно отметить, что это не первая попытка сохранить национальное цифровое наследие. В 2007 году библиотечное управление провело аналогичный сбор данных. Однако до сих пор результаты исследования не были опубликованы.
В середине июля 2017 года был объявлен тендер, согласно которому компания-победитель обязуется завершить захват ирландской части интернета к концу ноября. В общей сложности алгоритмы должны просканировать более 230 тысяч сайтов на домене .ie и других доменах, представляющих исторический интерес.
Как
Около 60% национальных библиотек Европы действуют на основании специальных законов при проведении захвата веб-контента. Например, Королевская библиотека в Копенгагене ежегодно проводит четыре таких «среза». Без точечного законодательного регулирования захват контента ограничен. Так, чтобы создать веб-архив выборов и референдумов (этим библиотека занимается с 2011 года), потребуется получить согласие частных лиц. Нерешенной остается проблема захвата видеоконтента, который пока не входит в список ключевых веб-мишеней. В ограниченном объеме осуществляется захват содержимого соцсетей.
Дата публикации: 28.07.17
1. Как правильно провести служебное расследование: этапы, сроки и формы документов
2. Делопроизводство от А до Я. Работа с обращениями граждан
Знаете как сделать портал лучше? Поделитесь идеей.