Сканирование текстов

Безусловно, сканирование текстовых документов – самая распространенная работа, выполняемая на планшетном сканере. Собственно, этот тип оборудования и создавался для обработки плоских бумажных источников.

В дальнейшем предполагается разобрать следующее:

Источники для сканирования текста могут быть довольно разнообразными. В первую очередь это:

Разрешение, как и во всех остальных ситуациях, зависит от назначения (см. отдельное описание).

Цели сканирования: эл.копия (в том числе книги), OCR, публикация текстового фрагмента, улучшение оригинала

Уже на стадии сканирования нужно принять решение о том, в каком формате сохранять файлы. (PNG, TIFF)

Цветность целиком зависит от последующего использования. Причем можно говорить о балансе между соответствием оригиналу, читабельностью и экономией места при хранении или тонера при распечатке.

Укладка оригинала

При обработке многостраничного документа можно столкнуться с пропуском отдельных страниц. Так как большинство программ автоматически нумеруют файлы, вставить нужный скан в список по порядку можно только одним разумным способом. Давайте разберем это на конкретном примере.

При сканировании страниц получены их фалы Scan001–Scan0, но между страницами изображения

Действия по улучшению качества сканов

просвечивание текста с оборотной стороны листа

Форматы для сохранения книг


Copyright © 1993–2020 Мацкявичюс Д.А. Все права защищены.
Никакая часть сайта не может быть воспроизведена никаким способом без письменного разрешения правообладателя и явной ссылки на данный ресурс.