Внимательный взгляд на книжный сканер DOKO BS16

Введение

Начнем с того, что на самом деле DOKO BS16 – не только и не просто книжный сканер. Ведь кроме книг он позволяет получать качественные цифровые изображения и обычных текстовых документов (отпечатанных на листах А5-А4-А3), различных удостоверений личности (например, паспортов и водительских прав), иллюстраций, карт и схем, да и просто объемных предметов. Более того, это не только сканер, но и документ-камера, т.е. презентационное устройство для отображения изображений наблюдаемых предметов на большом внешнем экране и выполнении с ними различных визуальных эффектов. Таким образом это устройство многофункционально, как минимум 2-в-1.

Почему же тогда его называют именно книжным сканером? Ответ очевиден – чтобы подчеркнуть его основное назначение, его главное отличие. Дело в том, что устройством для получения цифровых копий «плоских» документов никого не удивишь. В нашу жизнь прочно вошли планшетные сканеры и МФУ самых различных марок и форматов. Да и использование закрепленной на штативе цифровой камеры для быстрого получения сканов документов тоже не назовешь чем-то оригинальным. Не говоря уже о многочисленных документ-камерах, широко применяемых в школах и других образовательных учреждениях. Но вот сканирование толстых книг или сброшюрованных архивных папок с документами, когда полноценно развернуть книгу (папку) не удается, а страницы ближе к линии переплета заметно изгибаются, - это задача нетривиальна и требует особого подхода. Конечно, соответствующие специализированные сканеры на рынке представлены уже давно и не одной моделью. Но все они «страдают» одним существенным недостатком – слишком высокой стоимостью в сотни тысяч и даже миллионы рублей. Так вот, уникальность DOKO BS16 и его аналогов состоит в том, что впервые предлагается доступное по цене решение, позволяющее получать качественные сканы книжных разворотов несмотря на все изгибы, и при этом даже удалять с изображений придерживающие страницы пальцы. И при розничной цене всего в 500-600 долларов эти устройства становятся интересны массовому пользователю, от библиотек и архивных служб до территориальных центров документооборота, многочисленных отделений банков и страховых компаний. Более того, уже первые отклики показывают, что и домашние пользователи проявляют к этим сканерам очевидный интерес.

Получить начальное представление о DOKO BS16 (и о его аналоге CZUR ET16) и, при необходимости, ознакомиться с подробной документацией на него можно на сайте www.book-scanner.ru. Но, как любое сложное устройство, этот сканер имеет свои «секреты», и его эффективное использование требует определенных навыков. Поэтому полезно разобраться с особенностями его устройства и использования, рассмотреть различные режимы сканирования и соответствующие им результаты.

Особенности конструкции и функционирования

DOKO BS16 относится к планетарным сканерам (см. определение в Википедии) и, по сути, представляет собой высокоразрешающую камеру на штативе. Он позволяет бесконтактным образом формировать, сохранять и обрабатывать изображения наблюдаемых объектов. Его схема выглядит следующим образом:

Сканер сравнительно компактен, его габариты ВхШхГ составляют 38х19.5х30.5cм, при этом расстояние от предметной плоскости до объектива около 33 cм. CMOS матрица камеры имеет 16 мегапикселей, что определяет максимальный размер изображений как 4608х3456. Полезно отметить, что используемый объектив с фиксированным фокусом имеет достаточную глубину резкости, что позволяет сканировать объекты различной высоты.

С первого взгляда обращает на себя внимание наличие встроенного ЖК монитора. Он небольшой, диагональ всего 2.7”. Назначение очевидно – отображение формируемых камерой сканера «живых» изображений. Однако его разрешения в 320x240 точек достаточно только для контроля правильности положения сканируемого документа в предметной плоскости. Данный монитор включается автоматически, но активен только в одном из режимов работы сканера. Здесь необходимо остановиться подробнее.

Дело в том, что основной режим работы устройства предполагает его подключение по USB к компьютеру и использование соответствующей управляющей программы, а именно приложения DOKO Book Scanner. В этом случае наиболее полным образом реализуются все заложенные функции сканера, формируемые изображения отображаются на компьютерном мониторе в окне программы, а результаты сканирования сохраняются непосредственно на диск компьютера. Необходимо еще раз подчеркнуть, что для данного режима важно не только подключение компьютера, но и запуск управляющей программы, причем именно в моде сканирования. Однако, сканер обладает собственным процессором и операционной системой, что позволяет ему работать не только под управлением компьютера, но и в автономном режиме. Для этого на лицевой панели сканера имеются базовые кнопки управления, в том числе для захвата и сохранения формируемых изображений.

Более того, в комплект поставки входит ИК пульт дистанционного управления с расширенным набором команд. При этом запись изображений будет выполняться на внешние устройства памяти - на USB диск («флешку») или на SD карту (при их одновременном подключении приоритет за USB диском). На панели разъемов с задней стороны основания сканера имеются соответствующие USB порт и SD слот:

Так вот, в автономном режиме, т.е. когда компьютер не подключен или программа сканирования не запущена, текущее изображение отображается либо на внешнем экране через VGA или HDMI выходы сканера (с разрешением от 1024х768 до 1920х1080) либо, при отсутствии других возможностей, на встроенном мониторе (с разрешением всего 320х240).

Презентационный режим

При подключении DOKO BS16 по HDMI/VGA к внешнему устройству отображения (ЖК-панели, телевизору, ТВ монитору, видеопроектору или интерактивной доске) кроме демонстрации формируемых изображений появляется возможность выполнения различных презентационных эффектов. Здесь можно упомянуть зеркальное отражение и поворот, увеличение и уменьшение, разделение экрана и картинка-в-картинке, «заморозку» экрана и отображение в негативе, добавление графических объектов.

При этом управление функциями отображения осуществляется кнопками экранного меню и/или ИК-пульта. Более того, для удобства управления презентационными функциями через экранное меню рекомендуется подключить к соответствующему USB-порту сканера стандартную компьютерную мышь. По сути, в этом режиме сканер может использоваться как классическая документ-камера. Но в таком качестве устройство не представляет особого интереса, поскольку ничего уникального не предлагает, а цена при этом относительно других документ-камер с аналогичными характеристиками оказывается слишком высокой. Эту возможность скорее надо рассматривать как бесплатное дополнение, которое можно использовать лишь от случая к случаю, но не в качестве основного применения. Например, оснастив таким сканером библиотеку, можно его же задействовать для презентаций во время встреч авторов с читателями. Поэтому не будем в деталях рассматривать использование DOKO BS16 в качестве документ-камеры, а лишь кратко перечислим несколько важных особенностей данного режима:

1. На подключенном к сканеру внешнем мониторе можно отображать либо текущее изображение с камеры либо изображение с другого источника VGA сигнала, подключенного к разъему сканера VGA IN (так называемый режим проходящего сигнала VGA Pass Through), например, изображение экрана компьютера (ноутбука). Переключение между этими изображениями выполняется по нажатию соответствующей кнопки на панели или пульте управления. Важно отметить, что режим VGA Pass Through автоматически активируется когда сканер находится в режиме «ожидания» (подключен к сети, но не включен).

2. Сканер оснащен как VGA, так и HDMI выходами, причем они активны одновременно. Это означает, что к сканеру можно подключить два внешних монитора (экрана) – и отображать текущее изображение одновременно на обоих. Однако в режиме VGA Pass Through сигнал с VGA IN входа передается только на VGA выход (HDMI будет отключен).

3. Базовые параметры формируемых сканером изображений (переключение Текст/Изображение, выбор цветового представления Цвет/(Ч/Б)/Негатив и другие) можно менять кнопками панели/пульта управления или в экранном меню (пункт Настройка). Однако установленные параметры оказываются действительными и для сканирования. Например, выбрав режим Изображение будем получать «сглаженные» изображения без резких переходов, в то время как для сканов текстовых документов рекомендуется режим Текст.

Режим сканирования

Захват изображений наблюдаемых предметов (сканов документов и книг) проще всего выполнять в автономном режиме. Для этого достаточно нажать кнопку Photo на ИК пульте или на панели управления самого сканера – и на подключенное устройство хранения (USB диск или SD карту) будет записан JPEG файл с разрешением 4608х3456. Особенностью этих файлов является их дата и время – вне зависимости от момента реальной записи все они сохраняются с одной и той же датой из прошлого (фактически это дата обновления встроенной ОС).

Однако предусмотрен еще один очень удобный способ – через выносные ручную кнопку и ножную педаль. Причем первая входит в комплект поставки, в то время как вторая пока поставляется только как дополнительная опция. Они подключаются к выделенному USВ порту в панели разъемов сканера и имеют длину кабеля соответственно 1 и 2 метра. По их нажатию собственно и выполняется команда захвата и сохранения изображения.

Важно подчеркнуть, что эти кнопка и педаль действуют не только в автономном, но и в компьютерном режиме сканирования. Последнее особенно удобно, когда одна или обе руки заняты (например, придерживают страницы разворота книги), так что кликнуть команду захвата изображения мышкой затруднительно.

К сожалению, получаемые в автономном режиме изображения не подвергаются никакой обработке - это просто снимки наблюдаемых сцен как есть. И если в кадр попали посторонние предметы (в том числе пальцы рук), то «вычищать» их потом придется вручную. Для переноса полученных изображений на компьютер необходимо отсоединить используемое устройство хранения от сканера и подключить его компьютеру. Хотя это и не сложно, но если делать постоянно – довольно утомительно.

В связи с этим становится понятным, что режим сканирования непосредственно в компьютер со всех сторон является предпочтительным. И дело не только в том, что на компьютерном экране формируемые изображения отображаются более четко (и их проще контролировать), и что сохраняемые изображения имеют правильные дату и время и записываются сразу на жесткий диск в соответствующую папку. Важнее то, что управляющая программа имеет встроенные интеллектуальные алгоритмы обработки и позволяет уже в процессе сканирования осуществлять необходимую корректировку изображений. В частности, она позволяет:

- выделять по контрасту объект (лист или книгу) на темном фоне (черный мат-подложка входит в комплект поставки) и сохранять в изображении уже только полезную часть сцены;

- автоматически разворачивать выделенный объект (например, лист А4) компенсируя ошибки его положения (неточности позиционирования по вертикали или горизонтали);

- удалять фон и контрастировать черно-белые текстовые документы, сохраняя при этом цветными логотипы, штампы и печати;

- автоматически удалять придерживающие книжные страницы пальцы;

- компенсировать небольшие изгибы книжных страниц, «выпрямляя» текстовые строчки;

- объединять последовательные снимки двух страниц (сторон) документа в одно изображение, что удобно, например, при сканировании паспортов или водительских удостоверений.

Что важно, сканирование можно выполнять как в ручном режиме, снимая по одному каждый документ – так и в авторежиме с заданным временным интервалом между снимками. Последнее очень удобно когда надо отсканировать толстую книгу или стопку листов. Кликнув один раз команду начала съемки далее достаточно лишь не забывать менять (переворачивать) страницы.

После сканирования полученные серии сканов можно подвергать дополнительным преобразованиям (в том числе групповым): поворот, вырезание фрагмента, повышение резкости и цветовой насыщенности, перевод в черно-белое или негативное представление, и другие. Одной из эффективных операций является распознавание текста и формирование соответствующих файлов в различных форматах.

Теперь рассмотрим некоторые особенности данной программы более подробно.

Программа сканирования DOKO Book Scanner

По структуре управляющая сканером программа DOKO Book Scanner состоит из двух самостоятельных частей, а именно подпрограмм ScanManage и DocCamera. Они конечно взаимосвязаны, в первую очередь на уровне папок и файлов, но работают фактически автономно. Первая из них в основном отвечает за пост-обработку уже отсканированных изображений, вторая управляет собственно захватом и записью изображений в различных режимах сканирования. При запуске сначала начинает работать ScanManage, из которой осуществляется переход в DocCamera (и обратный возврат). Надо сказать, что пост-обработка полученных изображений безусловно представляет важную и необходимую часть процесса сканирования, но функционально она довольно стандартна. Это уже упомянутые повороты и вырезание произвольного прямоугольного фрагмента, повышение резкости и цветовой насыщенности, перевод в черно-белое или негативное представление, распознавание текста и преобразование форматов изображений. Поэтому для целей настоящего материала основное внимание необходимо уделить именно вариантам сканирования.

Управляющее меню предлагает следующий выбор установок:

В первую очередь необходимо определиться с цветовым представлением. Понятно, что «Цветной» означает полноцветное 24-битное изображение, «Серый» - полутоновое серое (8 бит). Выбор «Ч/Б» приводит к бинарному изображению (но файл записывается как 8 бит) с автоматическим определением и удалением фона (этот вариант хорошо подходит для текстовых документов, в результирующем скане получается контрастный текст на чистом белом фоне). Что касается варианта «Штамп», то он является своеобразной интеллектуальной модификацией «Ч/Б» и позволяет в контрастном черно-белом документе сохранять цветные (но с повышенной насыщенностью) логотипы, печати и штампы (соответствующий ему файл - 24 бит).

Режим сканирования «Лист» предполагает автоматическое определение прямоугольной области с объектом наблюдения (листом бумаги или страницами книги на темном фоне мата-подложки) и сохранение в изображении только этой области с автоматическим ее выравниванием (разворотом) по вертикали. Режим «Книга» также выделяет границы объекта, но при этом еще и удаляет с изображения придерживающие страницы пальцы и компенсирует небольшие изгибы страниц, «выпрямляя» текстовые строчки. «ID» означает последовательную съемку двух сканов и их сохранение (стык в стык) в одном объединенном изображении (полезно для различных удостоверений личности). Ну а «Оригинал» предполагает сканирование объектов как таковых, без компенсаций и разворотов, но с возможностью либо автоопределения границ либо ручного задания размеров области сканирования (можно использовать, например, для прошитых папок с документами). Важно отметить, что при сканировании существует дополнительная возможность автоматического разделения по вертикали разворотов книги на отдельные страницы – при этом в отдельные файлы записываются как исходное изображение, так и левая-правая страницы.

Для пояснения и иллюстрации всех этих вариантов лучше всего привести несколько примеров.

Сканирование листов

Начнем с текстового документа, распечатанного на стандартном листе А4. В этом примере лист сознательно заметно развернут – чтобы проиллюстрировать его последующее вертикальное выравнивание самой программой. Однако в реальных условиях лучше избегать подобных ситуаций, по возможности обеспечивая более-менее правильное позиционирование объекта в предметной плоскости.

В окне программы в режиме сканирования «Лист» документ выглядит следующим образом:

Обращает внимание розовая рамка – она определяет границы автоматически выделенной прямоугольной области сканирования. Ниже приведены результаты сканирования для цветовых представлений соответственно «Цветной», «Серый», «Ч/Б» и «Штамп». Полученные изображения записываются как JPEG файлы с разрешением 2150х3024 и размером соответственно 3.3/3.0/2.0/2.0 МБ. Подчеркнем, что степень JPEG сжатия можно менять от 100% до 1% (и соответственно уменьшать размер файлов и визуальное качество получаемых сканов), но в данных экспериментах везде используется 100% JPEG качество.


Результат сканирования при выборе режима «Лист»/«Цветной».



Результат сканирования при выборе режима «Лист»/«Серый».



Результат сканирования при выборе режима «Лист»/«Ч/Б».



Результат сканирования при выборе режима «Лист»/«Штамп».


Необходимо отметить, снимаемый лист с текстом должен быть по возможности «плоским» (разглаженным), иначе все его неровности будут отражены в результирующем скане как искривлённые (неровные) границы.

Особенности сканирования глянцевых страниц

В данном случае сложность сканирования обусловлена яркими бликами, возникающими из-за отражения света от блестящих поверхностей. Что важно, эти блики присутствуют как при общем офисном освещении, так и при включенной подсветке самого сканера. Однако в зависимости от условий освещения положение и яркость бликов заметно меняются. Ниже приведены 2 характерных скана глянцевой обложки журнала.


Сканирование журнала в режиме «Лист» при выключенной подсветке сканера.



Результат сканирования журнала в режиме «Лист» при выключенной подсветке сканера.



Сканирование журнала в режиме «Лист» при включенной подсветке сканера.



Результат сканирования журнала в режиме «Лист» при включенной подсветке сканера.


Анализируя данные снимки, легко заметить, что при выключенной подсветке (используется общее освещение комнаты) возникает обширная засветка в правой нижней части изображения. А при включении встроенной подсветки сканера блик уменьшается в размерах и смещается в центр изображения. Из этого напрашивается очевидная рекомендация по минимизации подобных паразитных бликов. Можно попытаться «поиграть» освещением, поискать другое рабочее место для сканера или изменить расположение объекта сканирования в предметной плоскости. Так, для этого журнала удалось получить почти «идеальные» изображения просто сдвинув его из центра.


Результат сканирования журнала в режиме «Лист» при включенной подсветке сканера.



Результат сканирования в режиме «Лист» при включенной подсветке сканера, журнал смещен влево.



Сканирование в режиме «Лист» при выключенной подсветке сканера, журнал развернут и смещен вверх.



Результат сканирования в режиме «Лист» при выключенной подсветке, журнал развернут и смещен вверх.


Сканирование книг

Теперь в качестве исходного материала возьмем разворот довольно старой книги 1978 года издания с уже пожелтевшими страницами (стр.146-147, всего страниц 495).


Как уже отмечалось, для подобных объектов рекомендуется использовать режим «Книга» - он позволяет убирать пальцы и компенсировать небольшие изгибы страниц разворота. Чтобы проиллюстрировать последнюю функцию, сначала приведем скан этого разворота в режиме «Лист», предназначенном для плоских документов. А вслед за ним – результирующее изображение (скан) уже в режиме «Книга» - «выравнивание» текстовых строк очевидно.


Результат сканирования при выборе режима «Лист»/«Цветной».



Результат сканирования при выборе режима «Книга»/«Цветной».



Результат сканирования при выборе режима «Книга»/«Серый».



Результат сканирования при выборе режима «Книга»/«Ч/Б».


Полезно подчеркнуть, что при сканировании книг можно дополнительно использовать функцию автоматического разделения на страницы. Для этой команды даже определена специальная горячая клавиша F3 (хотя ее можно переназначить). По сути оно сводится к разделению по вертикали результирующего изображения на его левую и правую половинки.

При нажатии F3 сначала сохраняется полное изображение сцены:


Затем оно подвергается коррекции в соответствии с выбранным режимом сканирования «Книга», и уже потом разделяется на 2 изображения левой и правой страниц:


Результат сканирования при выборе режима «Книга»/«Цветной»/Разделение (левая страница)



Результат сканирования при выборе режима «Книга»/«Цветной»/Разделение (правая страница)


При сканировании толстых книг постоянно возникают ситуации, когда приходится придерживать страницы разворота пальцами рук – иначе они загибаются (чаще всего это требуется ближе к началу или концу книги). Но, как уже отмечалось, интеллектуальный алгоритм обработки для режима «Книга» позволяет убирать эти пальцы, что иллюстрируется нижеследующим примером.


Сканирование в режиме «Книга» с придерживанием левой страницы пальцем.



Результат сканирования в режиме «Книга» разворота с придерживанием левой страницы пальцем.


Будучи объективным необходимо подчеркнуть, что проиллюстрированные корректирующие функции программы сложны в реализации и могут «ошибаться», особенно в сложных ситуациях когда изгибы страниц слишком велики или когда в силу недостатков освещения возникают заметные боковые тени (в том числе от пальцев рук). Поэтому всегда рекомендуется обеспечивать оптимальные условия для сканирования (правильно позиционировать объект, включать лампы подсветки, распрямлять страницы) – тогда программа сможет эффективно бороться с оставшимися небольшими недочетами.

ID сканирование

Как уже отмечалось, режим ID предназначен для автоматического объединения сканов двух сторон (страниц) любого документа (удостоверения) в одном изображении. В качестве примера возьмем почтовую открытку:



Полученное ее двухстороннее изображение выглядит так:



Сканирование сброшюрованных документов

В повседневной деятельности различных российских организаций возникает огромное количество различных документов с подписями и печатями, которые по завершению каждого отчетного периода приходится группировать, сшивать в отдельные книги и далее хранить годами. Соответственно время от времени возникает потребность сканировать отдельные листы из этих книг не нарушая целостности последних. Надо сказать, что задача во многих случаях весьма непростая, так как методология сшивания с использованием дыроколов и веревок не предполагает последующего полноценного разворота. И в отличие от обычных книг сшиваемые документы обычно изначально распечатываются без достаточно широких полей, учитывающих потребности переплета. Как следствие, при развороте подобных книг (папок) возникают сильные изгибы страниц, а часть важной информации оказывается как раз на границе перегиба. Для таких сложных объектов обычно мало подходят режимы «Лист» и «Книга» (хотя можно пробовать). И тогда приходится использовать режим «Оригинал», поскольку он позволяет вручную устанавливать область сканирования.


Окно программы с книгой прошитых документов.



Результат сканирования в режиме «Книга»/»Цветной».



Окно программы с разворотом книги прошитых документов (режим «Лист»).



Результат сканирования в режиме «Лист»/«Цветной».



Результат сканирования в режиме «Книга»/«Ч/Б»/Разделение (правая страница).



Окно программы с разворотом книги прошитых документов («Оригинал», выделена область сканирования).



Результат сканирования в режиме «Оригинал»/ «Ч/Б».



Окно программы с разворотом книги прошитых документов («Оригинал», выделена область сканирования).



Результат сканирования в режиме «Оригинал»/ «Серый».


Сканирование объемных предметов

В заключение еще раз напомним, что данный сканер позволяет получать снимки объемных предметов. Для иллюстрации в качестве примера была взята большая керамическая кружка:


Окно программы с трехмерным объектом (режим «Оригинал»).



Результат сканирования в режиме «Оригинал»/ «Цветной».