Стоик
   e-mail: stoik@stoik.ru
тел. (045) 366-9006
        366-4508
        962-8243
        962-8643

http://www.stoik.ru/articles.php?cat=1&subcat=0&article=2018_05_99_2
DOKO CamScanner X08A3 как инструмент для сканирования документов и книг
 
Стоик-М
http://www.stoik.ru/
 

DOKO CamScanner X08A3 как инструмент для сканирования документов и книг

Сегодня высокоразрешающие USB камеры, установленные на гибком или жестом штативе, становятся все более распространенным и востребованным офисным инструментом для получения цифровых изображений различных предметов и сцен. Подобные устройства по своему назначению одновременно относятся к презентационным документ-камерам, используемым для формирования и отображения с увеличением на компьютерном экране изображений наблюдаемых предметов, так и к планетарным документ-сканерам, применяемым для бесконтактного получения цифровых копий различных документов. Именно в силу этой многофункциональности такие устройства получили особое названиеCamera-Scanner (CamScanner ). Они обеспечивают быстрое и качественное сканирование самых различных объектов размером от визитки до формата А3: текстовых документов, разворотов книг и журналов, рисунков и карт, объемных предметов. Интеллектуальное ПО позволяет определять границы сканируемого документа и обрезать края, выравнивать изгибы страниц, удалять фон и даже придерживающие страницы книги пальцы.

Еще недавно типовое разрешение CMOS матриц, используемых для регистрации формируемых камерой изображений, составляло всего 3-5 мегапикселей. Но на сегодня оно уже достигло важного порога в 8М. Именно 8 мегапиксельные камеры для документов формата А4 (297х210 мм или, по другому, 11,69х8,29 дюймов) обеспечивают выходное разрешение в 300 dpi, что является необходимым для сканирования текстовых документов с целью их последующего устойчивого распознавания. Впрочем, на рынке уже не редкость модели с 10, 14, 16 и даже 20 мегапикселями, однако их слишком высокая розничная цена ограничивает реальный спрос.

Что касается модели DOKO CamScanner X08A3, то она как раз относится к наиболее востребованным 8-мегапиксельным камерам. С подробным описанием и техническими характеристиками камеры можно ознакомиться на официальном сайте www.doko.pro.

Несколько слов про ее наиболее важные особенности. Во-первых, это телескопический раздвижной штатив и изменяемый фокус объектива. Это позволяет эффективно изменять поле зрения камеры от А4 до А3. Отметим, что сам штатив складной, так что в нерабочем положении она занимает совсем мало места на рабочем столе. Как и полагается, камера имеет встроенную подсветку из 6 светодиодных ламп, но по нашему опыту яркость подсветки у всех подобных устройств (вне зависимости от производителя или конкретной модели) явно недостаточна для реальной работы в полутемных помещениях. Камера оснащена объективом с фиксированным фокусом, что на наш взгляд является скорее преимуществом. Дело в том, что функция автоматической фокусировки мало того что делает устройство более дорогим, но и снижает качество результирующих изображений, так как часть светового потока «уходит» на эту автоподстройку.

Несомненно сильная сторона DOKO CamScanner X08A3 – интеллектуальное ПО. Дело в том, что программа DOKO Book Scanner перешла к камере от ее старшего брата – книжного сканера DOKO BS16. И в результате эта камера не только легко справляется с обычными текстовыми документами, но и позволяет сканировать развороты толстых книг (хотя и с определенными оговорками). Но обо всем по порядку.

Программа DOKO BookScanner работает в двух основных режимах: Сканирование (собственно захват и сохранение исходных изображений наблюдаемых предметов) и Обработка (редактирование захваченных изображений, в том числе распознавание текстовой информации). Она использует современные интеллектуальные алгоритмы автоматического определения границ предметов, отсечения фона и сохранения только «полезной» части формируемых изображений. Это позволяет существенно сократить объем цифровых данных, повысить скорость и эффективность сканирования многостраничных документов. Для этого уже на этапе Сканирования можно указывать тип сохраняемого изображения (исходное изображение без обработки, односторонний лист, разворот книги или двухсторонний документ (например, удостоверение личности)). Кроме того, здесь также можно выбирать цветовое представление сохраняемых изображений (полноцветное, полутоновое черно-белое, бинарное черно-белое, черно-белый текстовый документ с цветными оттисками печатей и штампов). Сканирование можно выполнять в ручном режиме (постранично - при нажатии кнопки), также как и в режиме авто – съемка серии с заданным временным интервалом. В процессе сканирования результирующие изображения сохраняются в автоматически создаваемых папках (для каждой сессии своя папка), имена которых отражают как текущую дату, так и время начала сессии. Это удобно при последующем поиске и анализе архивных изображений. В режиме Обработки полученные изображения можно подвергать классическим операциям поворота, изменения яркости, контрастности и цветности, выделения фрагментов. Что касается распознавания текстов, то оно основано на встроенном модуле ABBYY, в базовом варианте только для двух языков – русского и английского (хотя возможно расширение списка поддерживаемых языков).

Здесь основное внимание мы уделим именно этапу сканирования – поскольку от его результатов будет зависеть эффективность любой последующей обработки. Для начала несколько важных замечаний по использованию камеры.

1) В комплект поставки входит прорезиненный мат-подложка черного цвета. Именно на него следует помещать объекты сканирования - документы, книги, журналы и т.д. На черном фоне программа легко выделяет по контрасту «полезную» область сканирования, автоматически отсекая фоновую часть. Попытка использования подложки другого цвета (например, серо-голубого цвета) может приводить к ошибкам определения объекта сканирования.

2) Камера имеет раздвижной штатив, обеспечивающий возможность изменения высоты объектива над поверхностью сканирования от минимальных 24,5 см до максимальных 37 см (последняя соответствует риске на штативе А3). Понятно, что чем больше выдвинут штатив (т.е. чем выше расположен объектив) тем шире область сканирования (поле зрения) и тем меньше эффективное разрешение в результирующем изображении. В минимальном положении область сканирования камеры имеет размер 32х22,5 см, в максимальном 47х33,5 см. Кроме этих двух крайних позиций штатив имеет еще одно фиксированное положение, отмеченное риской А4 (на 1,5 см выше минимального), с высотой объектива 26 см и полем зрения 33х24см. На самом деле штатив можно устанавливать и в любом промежуточном положении, что обеспечивает «гибкость» подстройки поля зрения.

3) Как уже отмечалось, объектив камеры имеет фиксированное фокусное расстояние. Это означает, что по мере изменения расстояния от объектива до плоскости сканирования необходимо слегка корректировать и положение фокусировки (т.е. расстояние до регистрирующей CMOS матрицы). С этой целью объектив имеет поворотное кольцо с нанесенными рисками А4 и А3 (для соответствующих положений высоты объектива). К счастью, глубина фокуса формируемого объективом изображения достаточно большая, так что небольшие ошибки в ручной подстройке положения объектива не приводят к заметным искажениям. Более того, даже если по забывчивости сканировать А3 изображение с положением объектива А4 – потеря резкости не будет значительной.

Как уже отмечалось, в программе DOKO Book Scanner предусмотрено 4 основных режима сканирования: Лист, Книга, ID и Оригинал, и при этом для каждого из них имеется дополнительный выбор цветового представления изображений: Цветной (полноцветное изображение), Серый (черно-белое полутоновое изображение), Ч/Б (черно-белое бинарное изображение) и Штамп (предназначен для получения черно-белых изображений текстовых документов с сохранением (и даже усилением) цветных логотипов, оттисков печатей и штампов). Рассмотрим несколько характерных примеров, поясняющих назначение всех этих режимов.

Режим Лист, как следует из названия, рекомендуется для обычных текстовых документов, отпечатанных на стандартных листах бумаги. Он означает автоматическое выделение на темном фоне прямоугольной области с контрастным светлым предметом, при этом при сохранении изображения будет скомпенсирован имеющийся угол разворота, так что можно не особенно заботиться про горизонтальность (вертикальность) размещения листа в поле зрения – программа автоматически выровняет его изображение. В нижеследующей иллюстрации представлено окно программы в режиме предпросмотра (Preview) формируемого изображения листа А4. Важно отметить, что при этом штатив камеры выдвинут до положения А4, так что лист занимает большую часть поля зрения камеры. Розовой рамкой отображается прямоугольная область выделения, она почти точно совпадает с документом, так что при захвате (по команде Снимок) будет сохранена только информативная часть сцены. Результирующий снимок имеет размер 3142х2252 пикселей, т.е. примерно 7,1М.

Для сравнения приведем окно с изображением того же листа при штативе сканера в положении А3.

Как и следовало ожидать, видимое изображение в полтора раза меньше, а соответствующий снимок имеет размер 2236х1599, т.е. уже только 3,6М.

Теперь проиллюстрируем различные цветовые представления. Ниже представлены 4 снимка (отсканированные изображения при высоте штатива А4) все того же документа соответственно в модах Цветной, Серый, Штамп и Ч/Б.

Несложно отметить, что с точки зрения сохранения текстовой информации визуально лучше всего смотрятся варианты Штамп и Ч/Б. К тому же соответствующие файлы наиболее экономичны – размер Ч/Б «всего» 2,24МБ, а у штампа 2,45МБ - против 3,55МБ в цветной моде и 3,09МБ в сером варианте. Понятно, что приведенные значения носят весьма относительный характер, так как в каждом конкретном случае размер соответствующего файла зависит как от «насыщенности» сканируемого документа текстом и графикой, так и от установленного в программе уровня JPEG компрессии. Важным практическим моментом является пригодность полученных сканов для последующего распознавания текста, в том числе с помощью встроенного в программу модуля OCR. Как оказалось, результаты распознавания весьма схожи для всех четырех цветовых вариантов, единственно что для Ч/Б скана верхний логотип не определяется как включенное в текст изображение (что для бинарного представления вполне объяснимо). Для иллюстрации приведем полученный после распознавания текст документа для варианта Штамп:



ЭКСПОРТЕР ГОДА
ИМПОРТЕР ГОДА

ТОП-50

среди предприятий-лидеров Российской Федерации в сфере внешнеэкономической деятельности по
общегосударственному статистическому ранжированию

«ИМПОРТЕР ГОДА»

Товарная группа 847180

Реакторы ядерные, котлы, оборудование и механические устройства; их части -Вычислительные
машины и их блоки; магнитные или оптические считывающие устройства, машины для переноса данных на носители
информации в кодированной форме и машины для обработки подобной информации, в другом месте не поименованные или
не включенные: --устройства вычислительных машин прочие

ИНН | Предприятие                                                                               | место | Сумнм | обэи ) ДнРс | Дврс | КлСт |

ЗОЛОТО РЕЙТИНГА

7731501372

ООО "ОФИС КОМПЬЮТЕР СИСТЕМЗ ДИСТРИБЬЮШН"

1

6

1

2

2

1

7709861274

ООО "ПИКФОРМЫ"

2

20

9

4

4

3

7718755071

ООО "ИМПОРТТЕЛЕКОМ"

3

26

2

3

3

18

7705041866

ООО "ИБМ ВЕА"

4

33

7

9

9

8

7740000076

ОАО "МТС"

5

38

4

1

1

32

7709048326

ЗАО "ХЬЮЛЕТТ-ПАККАРД А.О."

б

44

12

14

14

4

7722134310

ЗАО "МВДИЦИНСКИЕТЕХНОЛОГИИЛТД"

6

44

3

11

11

19

5701000985

ОАО "АК 'ТРАНСАЭРО"

7

45

16

10

10

9

5031003890

ЗАО "РТСОФГ

8

47

13

12

12

10

7721557513

ООО "АЙПИСИ2Ю"

9

48

5

5

5

33

5260217741

ООО "ПРАВЫЙ БЕРЕГ-ЛОГИСТИКА"

10

54

8

6

6

34

7801435937

ООО "НИЕНШАНЦ-ПРОМАВТОМАТИКА"

11

55

6

7

7

35

7704648707

ООО "ДЕЛЛ"

12

60

14

13

13

20

7701870982

ООО "ЛАНМАКС"

13

63

11

8

8

36

7811365157

ООО "МАРВЕЛ КТ"

14

72

22

22

22

6

7733562074

ЗАО "ИНФОКОМЭКСИМ"

15

79

34

20

20

5

7708160477

ООО "ПЛКСИСТЕМЫ"

16

85

15

16

16

38

7719149612

ООО "СТОИК-М"

17

87

18

24

24

21



СЕРЕБРО РЕЙТИНГА

7728161870

ЗАО "САН МАЙКРОСИСТЕМС"

18

90

17

29

29

15

7725678533

ООО "ЛАЙТИМПЕКС"

19

92

25

15

15

37

2308150517

ООО "ДЕВЛАЙН"

19

92

19

17

17

39

7724718208

ООО "АЙПИ ЛОГИСТИКА"

20

96

20

18

18

40

7716545696

ООО "УПРАВЛЯЮЩИЕ МОДЕЛИ"

21

105

21

21

21

42

3908027443

ООО "АЛЬФАВИРТ"

22

106

27

36

36

7

7802417592

ООО "ОПЕН КОМПЬЮТЕР СОЛЮШНЗ"

23

108

29

19

19

41

7736501792

ООО "ИНФИНЕТ"

24

112

23

23

23

43

3904601593

ООО "ЭКОКОМП"

24

112

41

30

30

11

7705022366

ООО "КОМПАНИЯ "ДЕМОС"

25

118

32

32

32

22

7704621303

ООО "БГ ДИСТРИБЬЮШН"

26

120

42

38

38

2

7703001265

ФИЛИАЛ "СОНИ ЭЛЕКТРОНИКС" В МО

27

122

24

41

41

16

7710049028

ЗАО”ЮПСЭССИЭС(СНГ)"

28

125

31

25

25

44

3525222023

ООО "ГИПЕРКОМ С-3"

29

130

10

35

35

50

4028022058

ООО "НЛП АВТОЭЛЕКТРОНИКА-ЭЛКАР"

30

136

39

26

26

45

7811431184

ООО "КРИСТАЛЛ"

31

138

47

34

34

23

7719048808

ООО "ДЖИИ-ХЭЛСКЕА"

31

138

38

27

27

46

7716540659

ООО "МАРКО"

31

138

40

43 1

43

12

7729394758

ООО "ЦЕЛЕВЫЕТЕХНОЛОГИИ"

32

140

37

28

28

47

7722610880

ЗАО "ЦАТИ"

33

143

33

31

31

48

7725025502

ООО "СИМЕНС"

34

145

36

42

42

25



Российская Федерация, 107023,
г. Москва, ул. Суворовская, 10-А
Тел.: +7 (499) 346-20-81; +7 (495) 745-27-03; +7 (925) 115-10-00
office@unbr.com www.nbr.com.ru



Ну что сказать - вполне прилично! Несомненно, есть небольшие ошибки форматирования, но они на наш взгляд простительны.

Теперь рассмотрим второй основной рабочий режим сканирования –Книга. На самом деле, было бы точнее назвать его как Книжный разворот. Имеются следующие основные отличия разворота толстой книги от обычного листа:

- страницы получаются не плоские, а изогнутые, причем кривизна нарастает ближе к середине разворота (линии переплета), там где соединяющий страницы шов;

- соответственно строчки на страницах получаются не прямые, а тоже искривленные;

- освещенность страницы оказывается неравномерной, ближе ко шву возникают тени;

- нередко листы книги приходится придерживать за края пальцами, иначе они поднимаются почти вертикально.

Собственно, особенность режима Книга состоит именно в том, что программа за счет встроенных интеллектуальных алгоритмов пытается исправить неизбежные при сканировании книжных разворотов дефекты сканов. И во многих случаях ей это удается!

Рассмотрим несколько примеров. Ниже представлено окно программы в режиме предпросмотра (Preview) формируемого изображения разворота книги. По размеру он не превышает А4, так что разумно сканировать при высоте штатива в положения А4. В данном случае для наглядности пока выбран режим Лист, так что розовая рамка позволяет оценить кривизну страниц.

А вот полученный скан в режиме Лист-Серый:

Очевидна кривизна строк, и при этом это еще не самая толстая книга!

А теперь посмотрим на скан, полученный в режиме Книга/Серый:

Даже визуально заметно улучшение полученного изображения, а последующее почти безошибочное распознавание подтверждает данный вывод.

Более того, в существенно более сложных случаях, когда приходится придерживать страницу разворота пальцем, программа иногда позволяет найти и удалить со скана изображение этого пальца.

Окно программы с разворотом книги:

Полученный скан в режиме Книга-Ч/Б:

Увы, не стоит обольщаться и строить радужные планы – данный алгоритм очень сложный, а камера CamScanner X08A3 в отличие от специализированного сканера DOKO BS16 все же в основном предназначена для сканирования документов, но не книг. Так что в большинстве случаев либо пальцы остаются, либо результирующее изображение оказывается сильно искаженным (хуже чем оригинал), либо и то и другое одновременно. Результат непредсказуем и зависит от множества факторов, в том числе от освещения (наличия теней), контраста сцены, величины кривизны страниц. Например, скан того же разворота, но в режиме Книга-Серый:

Здесь и палец остался и вторая страница вдруг оказалась как-то странно искаженной.

Теперь пример сканирования другого разворота книги. Скан в режиме Лист-Серый:

Тот же разворот в режиме Книга-Серый:

Теперь придерживаем правую страницу пальцем, скан в режиме Книга-Цветной:

И в аналогичных условиях (придерживающий палец справа) скан в режиме Книга-Серый:

Опираясь на эти результаты можно порекомендовать не надеяться на чудодейственные возможности программы и избегать придерживания страниц пальцами. Если же без этого никак, то придется поэкспериментировать с различными режимами, с освещением и т.д. Даже легкое изменение положения книги может кардинально изменить результат.

Заканчивая рассмотрение режима Книга нельзя не остановиться еще на одной полезной функции, а именно на автоматическом разделении разворота на страницы. Т.е. в результате сканирования получается сразу два файла соответственно со сканами левой и правой страниц.

Нижеследующий пример иллюстрирует эту возможность. Исходное изображение разворота:

2 результирующих скана:

.

Теперь кратко рассмотрим режим ID. Он предназначен для сканирования различных удостоверений личности и позволяет 2 последовательных снимка одного документа объединять в одном изображении. Это удобно, например, при сканировании страниц паспорта (например, главной страницы и страницы с регистрацией) или водительских прав.

При съемке страницы документа будут автоматически обрезаться по границам, кроме того в Окне предпросмотра будут отображаться («мерцать») напоминания «Первая сторона» и «Вторая сторона».

Полученное результирующее изображение:


Ну и наконец несколько слов про режим Оригинал. Его основная идея – не полагаться на интеллектуальные возможности программы, а снимать наблюдаемую сцену как есть, лишь задавая в ручном режиме границы области сканирования. В данном примере используется газета формата А3, в ее изображении выделена прямоугольная область сканирования (розовая рамка):

А вот и полученный скан:

Таковы основные возможности имеющихся режимов сканирования. Напомним, что в программе DOKO Book Scanner имеется самостоятельный модуль постобработки полученных изображений. И он позволяет выполнять типовые базовые операции, такие как поворот, изменение яркости, контрастности и цветности, выделение фрагментов, разделение на страницы, распознавание текста.

Завершая настоящий обзор и подытоживая представленные результаты, можно сделать уверенный вывод, что документ-камера DOKO CamScanner X08A3 действительно является эффективным офисным устройством для быстрого и гибкого сканирования самых различных документов. Рекомендуем к использованию!