Сканирование книг: быстро и без сканера

В статье рассказывается о том, как можно оцифровать бумажные документы, используя фотокамеру и фотоувеличитель. Автор подробно описывает сам процесс сканирования, но ничего не рассказыват об особенностях постобработки изображения.

Представим, вам в руки попалась на время интересная и ценная книга, быть может, раритет. Вам необходимо эту книгу отсканировать и распознать. Посмотрим как можно организовать сканирование книг быстро и без сканера..

Можно сделать очень качественную цветную копию книжной страницы при помощи сканера. В зависимости от дальнейших задач, ее можно сохранить в электронном виде и затем рассматривать на мониторе или отпечатать на принтере. Можно также страницу распознать и сохранить уже в текстовом формате.

Казалось бы, при такой технике вопрос о копировании книг решен, но это не совсем так. Если речь идет о высококачественных иллюстрациях, то приходится выбирать высокое разрешение, а, значит, сканирование будет долгим и нудным, каждая страница потребует минуты и более. К этому времени добавим время, необходимое для перелистывания страниц. Толстую книгу нужно еще расправить и плотно прижать к стеклу сканера, а это удается не сразу и не всегда. В итоге, на копирование небольшой книги уходит до нескольких часов.

Существуют специальные сканеры для копирования книг. В некоторых из них даже производится механическое перелистывание страниц. Скорость сканирования доходит до 500 страниц в час. Однако стоимость такого сканера равна стоимости легкового автомобиля, а среднерыночная стоимость копирования (оцифровки) книги на них около 10 000 рублей.

Быстродействующий сканер для оцифровки книг всем хорош, кроме слишком высокой цены.


Как показывает опыт, сканирование можно с успехом заменить обычным цифровым фотоаппаратом. Необходимо лишь сделать приспособление для его жесткой установки. Сделать его можно из старого фотоувеличителя. Он состоит из столика с укрепленной на нем штангой, по которой скользит кронштейн с осветителем и объективом. Для наших целей нужен только кронштейн. Снимите все лишнее, и у вас останется квадратная рамка с отверстием. А дальше посмотрите на ваш цифровой аппарат. Все дело в том, что размеры и конструкции их очень разнообразны. Но у всех на передней стенке имеются окошки, где расположены датчики автофокуса (они же определяют экспозицию и диафрагму при съемке в автоматическом режиме). Если размеры фотоаппарата малы, можно просто положить его на рамку, и в ее отверстии свободно поместится и объектив, и окошки датчиков, и аппарат. В таком случае вам останется лишь закрепить аппарат при помощи резиновых колечек. Если вспышка окажется перекрыта рамкой увеличителя, можно вырезать в ней дополнительное окошко выхода света и снимать со вспышкой или, отключив ее, снимать при внешней подсветке.

Цифровой фотоаппарат, установленный на простейшем приспособлении, позволяет копировать книги с очень высокой четкостью.

Если аппарат не помещается в отверстие рамки, замените ее на другую, вырезанную из фанеры. Примерные размеры рамки для крепления одного из фотоаппаратов приведены на рисунке. Эта рамка крепится к кронштейну при помощи двух болтов диаметром 6 мм и состоит из полки, на которой крепится фотоаппарат, упора для крепления к кронштейну и двух ребер жесткости. Вся конструкция собирается на клею ПВА и стягивается винтами-саморезами.

Подсветка

 

Теперь вернемся к разговору о подсветке. Она должна быть прежде всего равномерной, что легко проверяется при помощи монитора фотоаппарата. Для подсветки годятся настольные лампы или торшеры. Обычные лампы накаливания могут давать на снимках некоторую желтизну, и если необходимо более высокое качество цветопередачи, используйте светильники с галогенными лампами накаливания.

Очень равномерную подсветку можно получить с длинными люминесцентными лампами. Однако их свет мелькает с частотой 100 раз в секунду. Чтобы это не отразилось на съемке, нужно выбирать экспозицию длительностью 0,1 — 0,5 секунды. Компактные люминесцентные лампы допускают более короткие экспозиции. Главное обеспечить хорошую подсветку изгибов переплета, это самая важная и самая сложная деталь скана для оцифровки и распознавания.

После того как съемка книги закончится, подключите аппарат к компьютеру и отправьте информацию в программу распознавания текста, например Abbyy FineReader. В последних версиях программы качество распознавания сложных текстов значительно улучшилось, программа хорошо распознает изгибы переплета, плохо пропечатанные участки и прочие огрехи оцифровывания.

Таким образом очень легко распознавать большие объемы текста, который просто невозможно достать в электронном виде.

Журнал «Юный Техник»


Комментарий нашего специалиста:

В данной статье рассказывается о том, как без затрат времени и денег сделать книжный сканер для оцифровки документов. Интересным моментом является использование фотоувеличителя. Сохранившиеся увеличители доцифровой эпохи вряд ли можно использовать при сканировании. Конечно, идея  использования подвижного штатива для съемки не нова, но предложенный в статье вариант выделяется своей экономичностью. Следует также отметить, что отсутствие прижимного стекла и игнорирование использования специальных ламп сказывается на качестве сканирования далеко не самым лучшим образом. Обычного света ламп в комнате не  хватает. А при сканировании книг изгибы книг будут  мешать последующей обработке. Как и в предудыщих статьях, автор не приводит никакой статистики по скорости оцифровки изображений.

Яндекс.Метрика
+7 (812) 309-78-59 | +7 (495) 223-46-76 | scan@atiz.ru
ООО "Алее Софтвер" © 2017