Сканирование текстов

Безусловно, сканирование текстовых документов — самая распространенная работа, выполняемая на планшетном сканере. Собственно, этот тип оборудования и создавался для обработки плоских бумажных источников.

В дальнейшем предполагается разобрать следующее:

Источники для сканирования текста могут быть довольно разнообразными. В первую очередь это:

Разрешение, как и во всех остальных ситуациях, зависит от назначения (см. отдельное описание).

Цели сканирования: электронная копия (в том числе книги), OCR, публикации текстового фрагмента, улучшение оригинала.

Уже на стадии сканирования нужно принять решение о том, в каком формате сохранять файлы. (PNG!, TIFF)

Цветность целиком зависит от последующего использования. Причем можно говорить о балансе между соответствием оригиналу, читабельностью и экономией места при хранении или тонера при распечатке.

Укладка оригинала....

При обработке многостраничного документа можно столкнуться с пропуском отдельных страниц. Так как большинство программ автоматически нумеруют файлы, вставить нужный скан в список по порядку можно только одним разумным способом. Давайте разберем это на конкретном примере.

При сканировании страниц получены их фалы Scan001–Scan0, но между страницами изображения

....


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


....


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Порядок обработки текстового скана

Гм-гм-гм, как всё просто с учетом изложенного выше. Но есть целый «мешок» нюансов, о которых следует побеспокоиться.

Первичным назначением такого сканирования является получение копии документа, который можно просматривать с экрана или распечатывать.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!



Copyright © 1993–2024 Мацкявичюс Д.А. Все права защищены.
Никакая часть сайта не может быть воспроизведена никаким способом без письменного разрешения правообладателя и явной ссылки на данный ресурс.