Изготовление электронных книг при помощи фотоаппарата

В статье рассказывается о том, как сделать книжный  сканер на основе цифровых фотокамер  в домашних условиях с минимумом затрат. Автор поясняет все технические и программные сложности. Также приводятся иллюстрации конструкции будущего сканера, на которой подробно показано, как направить свет, чтобы качество получаемого изображения было максимально высоким. В стать также подробно рассматривается вопрос обработки полученных скан-копий графическом редакторе.

В период обучения в институте мне неоднократно приходилось сталкиваться с ситуацией, когда нужно было воспользоваться литературой из институтской библиотеки. В силу редкости экземпляров книг и широкого спроса на них в предсессионный период, работать с ними можно было только в читальном зале или взяв на одни сутки домой. И тот и другой вариант не позволяют провести серьезную работу с источниками при написании курсовых и дипломных работ. Самый удачный выход в такой ситуации — перевод книги в электронный вид.

На рынке оборудования можно встретить достаточное количество предложений, предназначенных для сканирования книг. Однако большая часть этих решений ориентирована на корпоративный и государственный сектор, имея стоимость хорошего автомобиля. Правда встречаются исключения, как например, сканеры линейки OptiсBook фирмы Plustek. Но и они стоят в 3-4 раза дороже обычных сканеров. Анализ ряда решений для сканирования книг на рынке показал, что они представляют из себя штатив для книги, камер и источников освещения. Подобную технологию можно легко имитировать дома, при наличии цифрового фотоаппарата с матрицей не менее 4 Мпикс. Хорошим подспорьем будет возможность управлять камерой с компьютера по USB при помощи специальных программ (например Cam2Com).

Для оборудования рабочего места необходимо прямоугольное стекло толщиной 4-6 мм, по ширине, превышающее книгу не менее чем на 10 см. Длина должна быть достаточной, чтобы на нём можно было создать противовес, в роли которого идеально подходят 5-6 книг большого формата (рис.1). Отличный вариант для выбора стекла — стеклянные дверцы шкафов старых мебельных стенок или шкафчиков. На стекло необходимо нанести маркеры, по которым вы будете определять размещение сканируемой книги. Это могут быть как отметки на обратной стороне стекла, так и приклеенные к нему реечки, позволяющие точно позиционировать книгу. Сканируемая страница будет укладываться на стекло сверху, так чтобы корешок разворота упирался в край стекла. Такой вариант размещения книги позволит добиться постоянного расстояния до фотоаппарата и отсутствие изгибов страницы, требующих дополнительной коррекции специальным программным обеспечением (например Book Restorer фирмы i2s.

После того как создана поверхность для сканирования, самое время заняться источниками освещения. Для этого необходимы 2 лампы-прищепки, с вращающимися головками. В них следует установить энергосберегающие лампы (люминесцентные) с эквивалентной мощностью 40-60 Вт. Можно, конечно, обойтись и обычными лампами накаливания, но они дают желтый цвет, что несколько затрудняет дальнейшую обработку книг, особенно при наличии в последних цветных иллюстраций. Лампы следует прикрепить так, что бы они не давали отражения на стекле, попадающего в объектив камеры, расположенной под стеклом. Оптимальный угол падения лучей на «свою» половину сканируемой страницы 45° (рис.2). В роли опор для ламп отлично подходят кухонные табуретки. Если есть возможность, то на абажуры ламп стоит прикрепить экраны из плотного картона, препятствующие попаданию света на камеру, во избежание появления на стекле блика от объектива и корпуса фотоаппарата.

После того, как вопросы освещения решены, осталось заняться размещением камеры. Для этого подойдет штатив с короткими ножками. Оптическая ось объектива фотоаппарата должна быть перпендикулярной поверхности сканирования и направлена в центр сканируемой страницы. Точку, в которую нужно поместить фотоаппарат легко определить с помощью отвеса (нить с привязанным к концу грузилом), приставленного снизу к стеклу в точке, где находится середина книги. Точное положение головки штатива, настройки резкости и экспозицию определяются при помощи пары-другой пробных снимков. Важно добиться максимального заполнения получаемых снимков изображением книги. Обычно это достигается изменением фокусного расстояния объектива (оптический зум). Отсутствие штатива — не помеха. Фотоаппарат можно разместить на двух книгах, подкладывая между ними небольшие предметы для выравнивания его положения. Если цвет корпуса фотоаппарата отличен от черного, то его следует замаскировать черной тканью или черной матовой бумагой. В противном случае возможно появление заметного блика на снимках.

Рис. 1. Схема конструкции. Вид сбоку.

Рис. 2. Схема конструкции. Вид спереди.

Рекомендации по выбору выдержки и диафрагмы.

Следует помнить, что чем больше число диафрагмы (чем меньше она раскрыта) тем больше глубина резкости и тем меньше будут заметны ошибки настройки резкости. Длина выдержки особой роли не играет, так как аппарат находится не в руках и изображение не будет смазываться. Оптимальной будет выдержка в пределах ½ — ¼ секунды. Формат снимков — предпочтительно RAW или иной, не использующий сжатие с потерей качества. Сохранять снимки на компьютере предпочтительно в формате TIFF, так как именно на этот формат ориентировано большая часть программного обеспечения, создающего PDF и DjVu файлы. Также этот формат позволяет избежать появление артефактов сжатия изображения, приводящих к ухудшению качества результата.

Обработка фотографий.

Итак вами получена серия снимков. Настало время подвергнуть их серьезной обработке. Ниже описано как это сделать используя Adobe Photoshop CS 2. Если все снимки получены при одинаковых условия, то можно, записав набор действий на одном снимке, обработать по нему весь пакет изображений.

Примеры изображений были получены по описанной методике с использованием фотоаппарата Olimpus C-3020 Zoom. Размер матрицы — 3,2 Мпикс, снимки делались в формате jpeg. Этого было достаточно для чтения книги с экрана и распознавания текста. Но для перевода в DjVu, на мой взгляд этого мало — слишком много дефектов на окончательном изображении.

Рис. 3. Фрагмент изображения

1. Для начала следует произвести в пакетном режиме обрезку снимков (Crop) и поворот (Rotate) нечетных (или четных) страниц. Цвет обрезанных страниц преобразуем в Grayscale (градации серого). Затем производится изменение размеров изображений так, чтобы у вас получились изображения разрешением 600 dpi и размерами, соответствующими размерам исходной книги.

Рис. 4.1. Фотоснимок после обрезки, обесцвечивания и изменения размера.

Рис. 4.2. Фрагмент изображения.

2. Полученные изображения пока еще слабо подходят для преобразования в DjVu из-за низкой контрастности, да и выглядят не очень приятно. Исправляем эту ситуацию при помощи инструмента Curves (Кривые), сдвигая точки белого и черного от краев графика, пока не получится хорошее контрастное изображение с минимумом дефектов.

Рис. 5. Фрагмент изображения.

3. Теперь осталось только отбросить промежуточные цвета при помощи инструмента Threshold и понизить палитру цветов изображения до 2х цветов (черный, белый).

Рис. 6 Окончательный вариант изображения, готовый к конвертации в DjVu/PDF.

Ссылка на статью: http://evil-punker.livejournal.com/138488.html

Комментарий нашего специалиста:

Данная конструкция объединяет преимущества планшетных книжных сканеров, а также сканеров  на основе ЦФК, по типу ATIZ. Сканируемая книга располагается на стекле. Технология сканирования такая, что фотографируется одна страница книги, поэтому искажение у корешка книги, которое характерно для сканеров фирмы Plustek, отсутствует. Сканирующим элементом являются цифровые фотокамеры. Необычное расположение камеры под книгой выделяют данный  аппарат из предложенных  на рынке таких разработок. Для закрепления стекла на котором располагается  книга, мы бы посоветовали использовать струбцину. Вариант использования 5-6 книг не гарантирует вам того, что данная конструкция когда-нибудь не опрокинется. Также удачным  решением является  расположение  источника света  по отношению к книге и фотоаппарату. Такая  конфигурация гарантирует минимум засветки и бликов. Отдельно  остановимся на программном обеспечении, автор статьи приводит программу  Cam2Com, к сожалению  перечень цифровых фотокамер представленных на сайте  разработчика давно устарел и снят с производства. Данные камеры в настоящее время  можно купить только с рук или на специальных  сайтах. Перечень действий необходимых  для обработки изображений  является достаточным  пособием для  опытного пользователя графических редакторов. К сожалению автор статьи не разместил информацию о том, какая скорость сканирования изображения и сколько времени тратится на обработку изображения.  Конечно, данная разработка успешна для студента и имеет место быть. Все задачи, которые поставил автор статьи, были успешно выполнены данным аппаратом.

Яндекс.Метрика
+7 (812) 309-78-59 | +7 (495) 223-46-76 | scan@atiz.ru
ООО "Алее Софтвер" © 2017