Создание электронных копий различных печатных документов очень важная и многоплановая задача. От формирования огромных цифровых архивов больших компаний и государственных учреждений до оперативного сканирования (так сказать, "на лету") различных рабочих документов, в том числе вне рабочего офиса. В зависимости от решаемой задачи нужно выбирать соответствующее ей оборудование, видов которого в настоящее время имеется уже достаточно много, а их стоимость отличается в десятки и даже сотни раз. Одной из разновидностей устройств для сканирования документов, получивших в последнее время большое распространение, являются планетарные сканеры или, как их нередко называют, документ-сканеры.

Справка Википедия: Планета́рный ска́нер (англ. planetary scanner) — разновидность сканера изображений, использующаяся для бесконтактного сканирования книг и сброшюрованных документов. Планетарные сканеры широко используются для оцифровки оригиналов, требующих деликатного обращения (ветхих, исторических документов). Часто используется название «книжный сканер».

Основным элементом планетарного сканера является сканирующая головка, расположенная на высоте нескольких десятков сантиметров над сканируемым объектом. Сканирующая головка может быть устроена по принципу сканирующей линейки и осуществлять сканирование посредством «просмотра» документа от одного края до другого. Также головки могут оснащаться матрицами, устроенными по принципу матрицы цифрового фотоаппарата. Такие устройства осуществляют сканирование за одно раскрытие затвора, что значительно ускоряет процесс.

Наиболее простыми из них (и соответственно наиболее доступными по цене) являются различные цифровые документ-камеры (USB камеры на штативах). Рассмотрим их устройство и возможности использования на примере документ-сканера DOKO CamScanner X510:

DOKO CamScanner X510 представляет собой довольно компактное (всего 337 х 128 х 100 мм в сложенном состоянии) USB-устройство для быстрого получения и сохранения цифровых изображений различных документов или предметов, страниц книг и журналов форматом до А3 с разрешением до 2592*1944. Конструкция камеры очень простая:

Сравнительно высокое разрешение и соответствующее качество изображений обеспечивается 5-мегапиксельной матрицей объектива и автоматической системой настройки фокуса, экспозиции и баланса белого. В комплект поставки входит специальный прорезиненный гибкий мат с разметкой, на котором удобно позиционировать подлежащие сканированию документы. Что важно, фон этого мата темный – белые страницы с текстом на нем достаточно контрастны, так что при обработке легко выделяются (лишнее обрезается), в том числе в автоматическом режиме.

Что касается программного обеспечения, то в комплекте имеется целый набор программного обеспечения, а именно: Document Scanner Manager – базовая программа для сканирования объектов и документов; ClassCam – специальная программа, в основном рекомендуемая к использованию при проведении школьных уроков и лекций для отображения объемных предметов; Camscanner – продвинутая программа с возможностью настройки различных параметров сканирования документов, в том числе захвата и сохранения их цифровых изображений, а также постобработки уже сохраненных изображений.

Понятно, что для создания и архивирования цифровых копий документов лучше всего подходит последняя из перечисленных программ. Она позволяет подстраивать сканер к условиям освещённости объектов сканирования, к текстуре и качеству копируемых документов. Именно она умеет автоматически выделять контрастный светлый объект на темном фоне, удаляя при сохранении поля по краям изображения и автоматически разворачивая его по оси. На нижеследующем рисунке приведено исходное изображение листа А4, размещенного на резиновом мате:

Изображение этого же документа с включенной функцией автоматического выделения и выравнивания:

Имеется также режим Автооцифровки: съемка серии изображений с заданным интервалом между кадрами (на смену или переворачивание страниц) и, при необходимости, с автоматическим выделением объекта. Получаемые изображения автоматически сохраняются в заданной папке по выбору как jpg, bmp, tif (или другие) файлы. По завершению захвата полученные изображения можно просмотреть, подкорректировать (контрастность, яркость или цветовую насыщенность), при желании создать его черно-белую копию. А также можно преобразовать в pdf файл, в том числе многостраничный. Что удобно, эта операция выполняется всего за несколько простых шагов.

Необходимо отметить, что в программу Camscanner встроен модуль распознавания текстов, разработанный компанией Abbyy. В целом процесс распознавания сводится к последовательному выполнению следующих операций:

  • редактирование изображений с целью повышения его качества, в том числе исправление перекосов, трапециевидных искажений и искажений строк;
  • ручное или автоматическое разделение изображения на несвязанные области (фрагменты), содержащие различные информационные объекты (текст, графика, таблицы);
  • запуск распознавания в пределах выделенных областей, корректировка результирующего документа (проверка орфографии) и его сохранение в соответствующем формате.

Нельзя сказать, что результат распознавания идеален, но в большинстве случаев вполне приемлем. Однако здесь встает более принципиальный вопрос – нужно ли выполнять корректировку (ретуширование) изображения и его распознавание? Или правильнее сохранять цифровую копию документа в исходном виде, совсем нетронутой? Очевидно, что ответ зависит от вашей задачи.

Удачное сочетание компактности и мобильности устройства, простоты его использования, достаточно высокого качества результирующих цифровых копий и доступной цены делает документ-сканеры DOKO CamScanner X510 весьма популярными. Самые разные компании активно используют их в своих бизнес-процессах. Вот только несколько откликов:

Студия анимационного кино «Мельница»

"...на этапе предварительных черновых съемок для проверки (по мере накопления) фазованного мультипликата на наличие ошибок и на качество анимации – эта операция называется LineТest"

Примечание: фазованный мультипликат – ряд кадров-картинок, являющихся основой мультипликационного фильма

ООО "Спецдепозитарий Сбербанка"

"…наши специалисты выезжают в отдалённые отделения, где есть необходимая документация. После сканирования документов данные с них вводятся в базу данных для работы. Иначе бумагу пришлось бы тоннами перемещать по стране. Сканы впоследствии уходят на хранение."

ООО "Леруа Мерлен Восток"

"…мы сканируем текущие документы, в основном это кассовые отчеты, товарные накладные, счет-фактуры, кассовые чеки. Документы при этом скреплены степлером, и мы их не расшиваем."

Однако надо предостеречь и о возможных проблемах использования. Пока сканируемые документы достаточно «плоские» (отдельные листы, тонкие брошюры, расшиваемые папки) и их можно разместить под объективом документ-сканера практически горизонтально - качество получаемых цифровых копий вполне приемлемое. Но в некоторых ситуациях отдельные листы сброшюрованы в толстые дела, расшивать которые затруднительно или недопустимо в соответствии с действующими инструкциями. Или, положим, кто-то захотел перевести в цифровой вид толстую книгу. Вот как выглядит скан документа в данном случае:

На рисунке отчётливо видны все недостатки получаемых электронных копий таких документов. Толщина книги и наличие переплета не позволяют раскрыть документ на угол, необходимый для качественной съемки, в результате получаются изображения с искажением и даже частичным скрытием текста в области корешка книги. Символы, попавшие в эту область, труднодоступны для прочтения, а копии страниц толстых книг зачастую имеют трапециевидную форму. Кроме того характерным недостатком является возникновение затемнения в корешковых полях книги. Налицо падение качества создаваемых цифровых копий. Всё сказанное справедливо и для толстых нерасшиваемых папок с документами.

Для копирования таких объектов существуют специальные устройства, так называемые "книжные сканеры". Но, учитывая их очень высокую стоимость (например, "Оптима V" или "ЭЛАР ПланСкан" от трёхсот тысяч рублей и выше), применение этих устройств рентабельно только в больших проектах, при создании крупных цифровых архивов документов или при сканировании особо ценных раритетных изданий.

В нашем же случае, то есть при использовании для создания цифрового архива документ-сканера X510, сканирование подобных "неудобных" объектов можно производить с помощью подручных средств, которые позволяют если не устранить совсем, то хотя бы уменьшить упомянутые выше недостатки. В качестве такого подручного средства можно, например, использовать обычное стекло достаточного веса, чтобы сгладить искажения, создаваемые переплётом. На нижеследующем рисунке копия разворота той же книги, но уже с прижимным стеклом:

Разница очевидна. Очевидны и недостатки, привносимые стеклом – блики, неравномерность освещения документа. Тут нужно подумать о системе освещения документа, которая позволяет устранить блики. Это может быть, например, система освещения отражённым светом. Кроме того, нужно учитывать увеличение времени затрачиваемого на копирование. С другой стороны, экономия средств при использовании X510 (цена в рознице меньше 10 тысяч рублей) по сравнению с книжными сканерами весьма значительна. Короче говоря, в каждом конкретном бизнес-процессе, где требуется создание цифровых копий документов, надо устанавливать некую границу допустимого и недопустимого качества этих копий и применять соответствующее этой границе оборудование.

С учётом всего вышесказанного и имеющейся документации можно рекомендовать применение документ-сканера DOKO CamScanner X510 в следующих случаях:

  • мобильная работа с документами на выезде;
  • оперативное получение цифровых копий рабочих документов;
  • оцифровка нерасшиваемых папок документов малых и средних объемов;
  • получение копий разноформатных документов от визиток до А3;
  • оцифровка ветхих и поврежденных документов (поскольку процесс сканирования бесконтактный);
  • получение изображений небольших по глубине 3D предметов.