Подпишитесь, чтобы быть в курсе

Главная > Статьи > Делопроизводство > Электронное делопроизводство > Сканирование документов в электронный архив. Часть II

Сканирование документов в электронный архив. Часть II

Прочитать позже   Отправить по e-mail

Сканирование документов в электронный архив. Часть II
Процесс сканирования, как это ни банально, начинается со сканера. Выбор сканера, а зачастую нескольких сканеров, которые будут участвовать в проекте по созданию электронного архива документов – задача не тривиальная. Поэтому остановимся по подробнее на этом вопросе.

Поточный (протяжной) сканер

Протяжные сканеры часто еще называют документными или поточными. Это обусловлено тем, что устройства данного типа могут сканировать только расшитые документы, отдельные листы бумаги, которые с помощью системы автоматической подачи протягиваются перед неподвижной сканирующей головкой.

Информация об изображении на поверхности листа преобразуется в цифровой вид и передается в компьютер для последующей обработки. В связи с тем, что скорость обработки документов в таких сканерах довольно высока (модели верхнего уровня способны сканировать до 150 страниц в минуту), процесс сканирования превращается в поток. Отсюда и название  поточные.

Исходя из вышесказанного можно сделать вывод: назначение протяжных сканеров  это работа в офисах, где важной составляющей бизнес-процессов является процесс ввода документов с бумажных носителей.

Эти сканеры позволяют автоматизировать процесс сканирования больших объемов офисной документации. Ролики системы автоматической подачи листов протягивают сканируемый оригинал перед неподвижной фотосчитывающей системой, которая преобразует отраженный от поверхности оригинала свет в последовательность электронных сигналов.

К сожалению, этот тип не предназначен для сканирования скрепленных листов, поэтому зачастую такие сканеры имеют встроенное планшетное устройство сканирования, либо присоединяемый планшет, приобретаемый отдельно. В такой связке документный сканер легко справится со сшитыми документами, книгой или журналом. Такой комбинированный тип сканера называют планшетно-протяжной.

Выбор сканера

Как выбрать сканер

Сегодня на рынке поточных сканеров представлено несколько ведущих игроков: во-первых так называемая «большая тройка» - Canon, Kodak (новое название Kodak Alaris), Fujitsu. Продукция данных компаний, как правило, высококачественные изделия их собственной разработки. Так же данную продукцию, но в меньшем ассортименте, предлагают такие маститые производители электроники как Panasonic, HP, Epson. Сканеры, продающиеся розничным покупателям под данными брендами, – как правило, продукция, изготовленная OEM-способом, то есть получаемая путём сборки типовых комплектующих в типовую конфигурацию. Компанию, которая занимается сборкой конечного продукта, называют OEM-производителем, а компанию, которая поставляет типовые комплектующие,  OEM-поставщиком. OEM-компонентами называется продукт, использующийся как составная часть завершенного продуктового решения. На сегодняшний день некоторые компании OEM-поставщики выводят свою продукцию на розничный рынок под своими собственными марками. Яркий пример  Avision, Microtek. Продукция под данными марками обладает схожими характеристиками с моделями известных брендов при этом имея более низкую стоимостью.

Для того чтобы среди многообразия документных сканеров выбрать модель, которая оптимально подойдет для решения поставленных заказчиком задач, необходимо объективно и четко определить и описать бизнес-потребности, связанные с вводом и обработкой документов.

Вот несколько вопросов, ответы на которые помогут существенно сузить круг рассматриваемой продукции и сделать в итоге правильный выбор:

  • Каков ежедневный объём документов, которые должны быть отсканированы?
  • Должны ли документы сканироваться в цветном или в чёрно-белом режиме? 
  • Являются документы одно- или двухсторонними?
  • Каков максимальный формат оригиналов?
  • Необходимо ли улучшение качества изображения в процессе сканирования?
  • Какие дополнительные возможности необходимы: 
– сканирование по сети, отправка по электронной почте, 
– надпечатки на отсканированных документах, 
– распознавание штрих кодов,
– сканирование сброшюрованных, сшитых, либо ветхих документов?
Все документные сканеры можно условно разделить на четыре категории в зависимости от производительности и рекомендуемой ежедневной нагрузки.
  • Сканеры малой производительности: скорость  до 30 л./мин., рекомендуемая нагрузка  до 2000 л./день.
  • Сканеры средней производительности: скорость  до 60 л./мин., рекомендуемая нагрузка  до 8000 л./день.
  • Высокопроизводительные сканеры: скорость  до 90 л./мин., рекомендуемая нагрузка  до 50000 л/день.
  • Сканеры для массового ввода документов: скорость  до 120 л./мин., рекомендуемая нагрузка  50000 и более л./день.

Для того чтобы приблизительно определить, какую скорость должен иметь сканер для решения поставленной задачи, нужно разделить объём работы на срок, за который её нужно выполнить. Таким образом, Вы сначала сужаете свой выбор до конкретной группы, а затем в зависимости от остальных требований делаете окончательный выбор.

Теперь, когда мы определили необходимую нам группу сканеров по скорости и нагрузке, пройдемся по другим характеристикам, которыми обладает сканер и которые так же могут повлиять на окончательный выбор.

Основные характеристики сканеров

Протяжной сканер
Ежедневная нагрузка рекомендованная производителем сканера нагрузка, при которой оборудование обеспечивает бесперебойную работу в течение заявленного количества часов. Время от времени допускается превышение этой нагрузки в пределах 30%  так называемая пиковая нагрузка.

Скорость сканирования. Указывая скорость, производители имеют в виду количество листов, обрабатываемых сканером в единицу времени. При этом, если речь идёт о двухстороннем сканировании, то это число умножается на два, поскольку в результате получается в 2 раза больше изображений. Скорость сканирования зависит от следующих параметров: 

  • формат оригинала – оригинал формата А4 будет отсканирован быстрее, чем А3;
  • ориентация бумаги  при горизонтальной (Landscape) загрузке бумаги скорость сканирования выше, чем при вертикальной (Portrait); 
  • разрешение  чем выше выбранное разрешение, тем ниже скорость сканирования;
  • режим сканирования (цветной, чёрно-белый, оттенки серого)  скорость работы в чёрно-белом режиме, как правило, выше, чем при работе в цвете или в оттенках серого; многие современные модели сканеров обрабатывают документы с одинаковой скоростью, независимо от выбранного режима. 

Максимальный формат оригинала. Максимальный линейный размер исходного документа, подаваемого в сканер. сканер может работать также со всеми форматами меньше максимального, начиная, как правило, с А8.

Максимальное оптическое разрешение. Современные сканеры сканирую как правило с разрешением 600 точек на дюйм (dots per inch, dpi). Есть варианты с разрешением 1200dpi. Выбор одного основных рабочих значений разрешения при сканировании (150, 200, 300, 400 dpi) как правило, реализован в драйвере сканера и устанавливается в диалоге сканирования.

Наличие дуплекса означает наличие одной или двух оптических систем и, соответственно, возможности одновременного сканирования обеих сторон документа. Современные модели сканеров, за редким исключением  двухсторонние.

Сканирование в цвете. Цветные модели позволяют обрабатывать документы в цветном режиме, в то время, как чёрно-белые  только в монохромном режиме и в оттенках серого. Сейчас все производители сканеров выпускают цветные модели, поскольку именно они дают пользователям максимум возможностей при работе с изображениями. 

Наличие планшета. Отличительной чертой документных сканеров является наличие автоподатчика  лотка для пакетной подачи бумаги. В то же время некоторые модели сканеров помимо автоподатчика оснащены планшетом для сканирования нерасшитых (сброшюрованных) или ветхих документов, требующих бережного отношения. Для некоторых моделей сканеров производители поставляют опциональные планшеты, что позволяет подключать и использовать планшет только тогда, когда он действительно необходим для сканирования книг, журналов, сброшюрованных документов, а затем легко снимать его, освобождая пространство на рабочем месте. 

Емкость автоподатчика (ADF) варьируется в пределах от 50 листов у моделей малой производительности и до 500 у сканеров для массового ввода документов. При этом, как правило, ёмкость указывается для листов плотностью 80 г/м2 (стандартная офисная бумага). Емкость ADF может играть немаловажную роль при обработке больших объемов документов, т.к. возможность загрузить единовременно большее количество листов может стать ключевым преимуществом в скорости обработки. 

Тип интерфейса. Способ (стандарт) подключения сканера к персональному компьютеру. Как правило это высокоскоростной USB порт. Возможно наличие у сканера нескольких интерфейсов подключения. Дополнительно сканер может быть оснащен сетевым интерфейсом или модулем беспроводного соединения.

Мы рассмотрели так называемые «железные» характеристики сканера, то есть параметры, определяемые конструктивной, аппаратной реализацией. Помимо данных характеристик, важно понимать свойства и функционал, которые добавляет сканеру программное обеспечение, прежде всего  драйвер сканера. 

Драйвер сканера

Драйвер сканера. Что это? 

В комплект поставки любого сканера входит пакет программного обеспечения, ответственного за правильное распознавание устройства при подключении к персональному компьютеру, а так же обеспечивающего его правильную работу. Данное специализированное ПО называется драйвер. Набор драйверов может различаться в зависимости от модели, но, существуют и универсальные интерфейсы, необходимые для взаимодействия сканера с операционной системой компьютера. В частности, нередко в описаниях сканера можно встретить такие аббревиатуры как TWAIN, WIA и ISIS-драйверы (стандарты, протоколы). Попробуем разобраться, что обозначает каждое название, и какие функции выполняет каждый из драйверов.

TWAIN 

На самом деле, TWAIN – это не аббревиатура, а слово, которое в переводе с английского означает «пара» или «двойка». Под «парой» здесь подразумевается тандем компьютер – сканер. Другими словами, TWAIN-совместимый драйвер необходим для того, чтобы операционная система компьютера могла взаимодействовать с устройствами создания и обработки изображений, в том числе и со сканерами. TWAIN драйвер сканера обычно выполнен в виде программного приложения с интуитивным пользовательским интерфейсом. Основная его функция – это передача информации от сканера к компьютерному приложению, через которое выполняются команды сканирования. Именно с его помощью производятся такие действия как предпросмотр изображений, предварительное сканирование, корректировка параметров (цвет, насыщенность и т.д.). И именно благодаря наличию TWAIN-драйвера, вы можете осуществлять сканирование из любой программы, где есть команда Scan.

WIA

Поскольку WIA расшифровывается как Windows Imaging Architecture, несложно догадаться, что этот стандарт создан специально для ОС Windows, и разработан он был компанией Microsoft. Он предназначен для более удобного управления сканером посредством стандартных и привычных для пользователей инструментов Windows. Например, именно благодаря драйверу WIA сканер отображается в диспетчере устройств компьютера при подключении, а мы можем привычным способом просмотреть его свойства и содержимое. Такой компонент драйвера как Scanner Wizard позволяет работать с изображениями с помощью стандартного интерфейса в виде окон. Данный интерфейс предлагает ряд возможностей для управления изображениями – предпросмотр, настройка разрешения, яркости, цвета, масштабирование и прочие. Таким образом, независимо от модели сканера пользователь может пользоваться привычными и понятными инструментами при работе с документами и изображениями. 

ISIS 

Интерфейс ISIS (Image and Scanner Interface Specification), так же, как и Twain создан для взаимодействия сканера и компьютера, но способен выполнять более сложные задачи. Он представляет собой совокупность модулей, каждый из которых выполняет определенную функцию (сканирование, конвертация, компрессия). Эти модули могут объединяться, образуя конвейеры для выполнения сложных, многоэтапных задач. ISIS предлагает разработчикам ПО надежный и стабильный интерфейс для интеграции задач, связанных со сканированием, в приложения. Поскольку ISIS является промышленным стандартом, пользователь сканера с ISIS-драйвером может быть уверен, что купленный им аппарат совместим со всеми приложениями операционной системы, разработанными с учетом данного стандарта. 

Функционал драйвера по обработке изображения

Функционал современного драйвера сканера не ограничивается только сопряжением сканера с компьютером и обеспечением правильного распознавания и работоспособность данного устройства. Драйвер нагружен большим количеством опций, позволяющих влиять на качество выходного изображения в процессе сканирования. Как правило, в драйвере присутствует предустановленный набор профилей сканирования: набор выбранных опций и значений, сохраненных под определенным именем. Зачастую есть возможность сделать собственный набор установок и сохранить его в виде отдельного профиля. Оперирование профилями позволяет пользователю сканера быстро переключать набор настроек в зависимости от типа обрабатываемых документов. 

Функционал драйвера по обработке изображения

Приведем основные функции корректировки изображения, которые содержат драйверы большинства современных сканеров: 

  • устранение перекоса  определяется либо по геометрии страницы, либо по содержимому страницы (горизонтальные линии, текст и т.п.);
  • подрезка  удаление внешних (черных) контуров изображения, которые могут появиться из-за неверного определения размера оригинала, либо в результате устранения перекоса;
  • очистка углов  в случае обнаружения загнутого угла программа пытается заполнить угол цветом фона;
  • автояркость  автоматический подбор параметра яркости у продвинутых моделей; многие сканеры имеют ручные установки яркости; 
  • удаление пятен  как правило, по заданному значению размера пятна; 
  • автоориентация (авто-поворот)  у продвинутых моделей, способных распознавать текст; определяется по ориентации текста;
  • четкость (резкость)  у продвинутых моделей, способных распознавать текст; позволяет сделать текст на изображении более четким;
  • заполнение отверстий от дырокола  функция работает как правило при сканировании в цвете;
  • автообнаружение цвета  способность определять цветные области (например фотографии) и сканировать данные области в цвете, а оставшиеся части  в ч/б режиме; позволяет существенно уменьшить размер файла выходного изображения при сохранении высокого качества и цвета там, где он есть;
  • подавление цвета  позволяет вычесть цвет фона; удобно использовать при сканировании не белой бумаги;
  • обнаружение пустой страницы  на основе заданного порогового значения наполненности страницы, программа может определить пустую страницу и пропустить ее;
  • распознавание штрих кодов  продвинутые модели умеют распознать штрих коды на изображении непосредственно при помощи драйвера и считывать их значение (только несколько типов ШК). 

Данный набор функций приведен для примера и, конечно же, варьируется в зависимости от производителя и модели сканера.

VRS Virtual ReScanПомимо драйвера, поставляемого в комплекте, существуют разработки, направленные специально на повышение качества изображения при сканировании. Решение представляет из себя некую надстройку над драйвером, значительно расширяющую функционал драйвера по корректировке изображения. Пример такого решения  технология Virtual ReScan (VRS) от компании Kofax. Базовое решение Kofax VRS некоторые производители поставляют в комплекте со своими сканерами, что выводит его на уровень промышленных стандартов качества сканирования. Работает по стандарту драйвера ISIS.

Программное обеспечение для сканирования

Программное обеспечение для сканированияВ комплект поставки протяжного сканера, помимо драйверов, как правило, включается диск с программным обеспечением для Windows и MacOS. Программное обеспечение идущее в комплекте, позволяет сканировать, сохранять, обрабатывать и выводить на печать полученное изображение. Обычно этот софт является специфическим для каждого типа протяжных сканеров. Кроме того, на рынке программного 11 обеспечения для сканирования, извлечения и обработки данных, существует много серьезных игроков, готовых предложить широчайший спектр программных и аппаратных решений под конкретные бизнес-задачи в дополнение к оборудованию для сканирования. 

Типы сканируемых документов 

В зависимости от модели, протяжный сканер может сканировать фотографии, письма, бланки, визитки и даже квитанции и чеки. Важное значение имеет лишь максимальный допустимый формат оригинала, а так же его плотность. Программное обеспечение большинства моделей дает возможность настраивать профили для различных типов сканируемых оригиналов. Это позволяет получать наилучшие результаты. К сожалению, протяжные сканеры не предназначены для обработки сшитой документации, журналов, книг и т.д. Для этих целей разработаны комбинированные модели со встроенным планшетом, либо производитель предлагает опциональный подключаемый планшетный модуль. 

Оптическое распознавание символов 

В своем большинстве, протяжные сканеры, используя программное обеспечение, довольно успешно сканируют и конвертируют печатные в редактируемые текстовые документы. Это позволяет при необходимости сразу после сканирования редактировать документ с помощью Microsoft World или другого текстового редактора. Либо создавать в результате сканирования файл в формате PDF с текстовым слоем (так называемый, PDF+text или searchable PDF), PDF файл с возможностью полнотекстового поиска. Данный тип файлов широко применяется для хранения в различных электронных системах и архивах. 

В связи с тем, что в данном цикле статей мы как раз изучаем процесс создания электронного архива, рассмотрим программное обеспечение, наиболее подходящее для решения задачи сканирования, обработки документов и сохранения их в формате PDF с текстовым слоем, а так же в специально разработанном стандарте PDF для архивов (PDF-A). 

В данной статье выше уже было упомянуто программное обеспечение компании Kofax Inc., мирового лидера в разработке программного обеспечения для ввода и обработки документов. Разработки Kofax  это широкий набор программ и модулей, обеспечивающих функционал любого уровня сложности и высокую экономическую эффективность. Основное назначение - преобразование документов в информацию посредством: улучшения качества изображения сканируемых документов; классификации документов и форм; извлечения данных; проверки результатов на полноту и корректность. Линейка программных продуктов Kofax включает в себя как приложения настольного уровня, так и системы автоматизации бизнес-процессов уровня предприятия.

Для задачи сканирования в электронный архив оптимально подходит программное обеспечение Kofax Express, которое разработчик позиционирует как Scan to Archive Solution, то есть именно решение для сканирования в архив. 

Рассмотрим подробнее возможности данного ПО.  

Обзор возможностей ПО Kofax Express 

Обзор возможностей сканирования ПО Kofax ExpressKofax Express – передовое и эффективное решение, предназначенное для поточного сканирования пачки документов, разделения её на документы, извлечения данных, проверки данных на корректность и последующего экспорта файлов и данных в файловую систему, а так же в любую систему электронного документооборота (СЭД), базу данных или электронный архив. 

Сфера возможного применения данного приложения весьма широка: это могут быть банки, страховые организации, транспортные компании, государственные учреждения и многие другие области деятельности, связанные с вводом и обработкой документов, где важна оперативность обработки, качество получаемых изображений и высокий уровень автоматизации процесса. 

Решение обеспечивает быструю обработку как малых, так и больших пакетов документов. Решение экономически выгодно, т.к. схема лицензирования не предусматривает каких- либо ограничений по объему отсканированных листов. Простое и доступное даже новичкам решение располагает мощными функциями, ориентированными на профессионалов. 

Kofax Express разработан как единое приложение, включающее все функции для использования на одном рабочем месте (автономная установка), когда вы планируете выполнять все операции администрирования, сканирования, индексирования, распознавания и экспорта на одном компьютере. Возможна так же установка Kofax Express в конфигурации клиент-сервер: применяется в случаях, когда сканирование, индексирование и экспорт должны выполняться на нескольких рабочих станциях, при этом сервер обычно используется для выполнения централизованных задач по управлению заданиями, пачками и профилями сканирования, а на клиентских рабочих станциях выполняются операции сканирования, индексирования и экспорта.

В случае объединения в сеть нескольких рабочих станций появляется возможность распределения обработки больших объёмов отсканированных документов среди нескольких сотрудников организации (операторы сканирования и операторы индексирования), что увеличивает скорость и эффективность всего процесса ввода документов и данных. При этом задача экспорта документов может быть реализована в виде службы (Windows service) и выполняться в фоновом режиме. 

В приложении Kofax Express используется фирменная технология Kofax VRS, которая представлена в виде полноценного компонента. Все возможности Kofax VRS доступны непосредственно из пользовательского интерфейса программы. 

Основные преимущества ПО Kofax Express 

  1. Интуитивно-понятный интерфейс Kofax ExpressИнтуитивно-понятный интерфейс в стиле MS Office 2007 для более удобного использования, возможность настройки панели инструментов. Полностью русскоязычный интерфейс и руководство пользователя.
  2. Быстрый динамический просмотр во время сканирования с возможностью передвижения и поворота страниц, увеличения их размера (приближение), визуализации передней и задней сторон страницы, объединения страниц в документ, разделения документа на несколько других, добавление отсканированной страницы в документ. 
  3. Работа с многоядерным процессором для более быстрого сканирования и одновременной обработки изображений с технологиями VRS.
  4. Встроенные технологии VRS во время сканирования, удобные кнопки в панели инструментов, возможность корректировки изображения технологиями VRS после сканирования и во время индексирования, переключение между чёрно-белым и цветным изображением отсканированных образов. 
  5. Возможность получения изображений не только со сканера, но и импорт изображений из папки (в форматах TIFF, PDF, JPG и BMP), полученных ранее с других сканеров, включая книжные, сетевые, а также с мультифункциональных устройств и фотокамер. 
  6. Разделение документов по пустой странице, штрих-кодам, патч-кодам или фиксированному количеству страниц в документе. 
  7. Возможность доступа к настройкам сканера непосредственно из интерфейса программы. 
  8. Возможность возврата к исходной версии обрабатываемых изображений (откат). 
  9. Пересканирование нужных изображений нажатием одной кнопки. 
  10. Индексирование данных из штрих-кодов и с изображения с помощью распознавания «налету» (Rubberband OCR), зонального распознавания (Zonal OCR) или ручного ввода данных (неограниченное количество индексных полей). 
  11. Связь с базой данных через ODBC-стандарт, сверка значений индексных полей с базой данных, поиск в базе данных по значению штрих-кода, обновление выпадающего списка индексов из базы данных.
  12. Уникальная технология Enhanced Bar-code для быстрого чтения 14 вариантов одно- и двухмерных штрих-кодов под разными углами, использование цветовой информации для обработки повреждённых штрих-кодов даже при качестве сканирования 100-150 dpi. 
  13. Настраиваемые сценарии экспорта файлов изображений (одностраничные JPEG/TIFF/PDF и мультистраничные TIFF/PDF) и файлов с индексами (TXT, XML) в MS SharePoint, в Kofax Capture или в любую папку. Экспорт в фоновом режиме.
  14. Формирование файлов PDF и PDF-A с возможностью текстового поиска (файлы с распознанным текстом - Searchable PDF). (Поддержка многих языков, включая русский). 
  15. Максимальное сжатие размеров цветного изображения до размера чёрно-белого без потери качества с помощью технологии VRS. 
  16. Открытый интерфейс программирования (API) для создания собственных сценариев экспорта и ннекторов с любыми системами документооборота или непосредственно в базу данных. 
  17. Включение/выключение режима администрирования позволяет администратору ограничивать доступ другим пользователям к различным настройкам и функциям. 

Вот неполный список возможностей ПО Kofax Express. Весьма внушительно для решения, которое разработчик позиционирует как решение начального уровня. Учитывая, что разработчик оказывает техническую поддержку данного программного обеспечения, постоянно совершенствуя его, данное решение можно смело рекомендовать к приобретению в целях сканирования в электронный архив.


Разъяснения по любым вопросам о поставках сканеров и программного обеспечения для создания электронного архива можно получить в Департаменте документных сканеров компании ПИРИТ

117218, Москва
Нахимовский проспект, д. 36, корп. 1, 2-й этаж
телефон: +7 495 785-5554 (многоканальный) 
cайт: docscan.ru 
e-mail: info@docscan.ru 

Смирнов А.В.
специалист по системам документооборота
департамента документных сканеров компании ПИРИТ

Полезная статья?
Да / Нет
Прочитать позже В избранное Отправить по e-mail
  • Поделиться в соцсетях:
Только зарегистрированные участники могут оставлять комментарии. Авторизуйтесь или зарегистрируйтесь

Материалы по теме:

Сервисы

Все сервисы

Ваши идеи

Знаете как сделать портал лучше? Поделитесь идеей.

Информационный портал НААР создан сообществом экспертов архивной отрасли РФ. Целью портала является сбор и обобщение, а также анализ всей информации, размещенной в Интернете и в других источниках, имеющей отношение к документам.
На сайте размещены свежие новости и пресс-релизы архивных компаний России, СНГ и зарубежья.

© 2016 - архивный портал naar.ru