Litvek: лучшие книги недели
Топ книга - Малиновый пеликан [Владимир Николаевич Войнович] - читаем полностью в LitvekТоп книга - Рассечение Стоуна [Абрахам Вергезе] - читаем полностью в LitvekТоп книга - Авиатор [Евгений Германович Водолазкин] - читаем полностью в LitvekТоп книга - Богатый папа... Бедный папа... [Роберт Тору Кийосаки] - читаем полностью в LitvekТоп книга - Слово Императора [Дарья Андреевна Кузнецова] - читаем полностью в LitvekТоп книга - 7 навыков высокоэффективных семей [Стивен Р Кови] - читаем полностью в LitvekТоп книга - В поисках потока. Психология включенности в повседневность [Михай Чиксентмихайи] - читаем полностью в LitvekТоп книга - Катушка синих ниток [Энн Тайлер] - читаем полностью в Litvek
Litvek - онлайн библиотека >> TWDragon >> Справочная литература: прочее >> Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро >> страница 3
сканера. У такой страницы в неизмененном виде — мало шансов быть распознанной без ошибок, и тем более она не будет иметь никакого «товарного вида» после сжатия и упаковки в DjVu или PDF.

Устранить все дефекты и повысить качество распознавания текста — поможет пакетная обработка.

2.1 ScanKromsator V5.92

Салютуем альтруизму разработчиков-добровольцев!

Программа ScanKromsator 5.92 (автор — уважаемый камрад bolega) — объективно лучший на данный момент процессор пакетной обработки изображений, специально «заточенный» под книгосканирование. Скачать программу всегда можно здесь: http://www.djvu-soft.narod.m/soft/.

Программа ScanKromsator — мощный инструмент для подготовки книжных сканов. Она автоматически и наилучшим образом выполняет операции разбиения по страницам (Split), углового выравнивания (Deskew), обрезки переплетов и полей страниц. Однако, потратив несколько минут на расстановку опций и проверку страниц — можно получать всегда отличные легко распознаваемые сканы с минимальными (только не для компьютера) усилиями. Кроме того, программа может сохранять сделанные настройки в виде сведений о заданиях (Tasks). Это позволяет при работе с большими книгами не бояться задать неправильные установки после перерыва в работе.


Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро. Иллюстрация № 7
Первый шаг при работе с Кромсатором — командой File=>Opeu Images… вызвать диалог открытия файлов с изображениями, и в нем выбрать ранее подготовленные сканы:


Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро. Иллюстрация № 8
В диалоге открытия присутствуют списки, влияющие на открытие многостраничных TIFF-файлов (некоторые программы сканирования позволяют сохранить несколько сканов в один TIFF-файл), и сортировку файлов после сформирования списка. Опцию «Sort Smart» («Умная» сортировка) стоит держать включенной всегда, и не отказываться от сортировки, так как обычная техника выбора файлов в Windows с помощью мыши и клавиши Shift — меняет местами первый и последний выбранные файлы в списке. Для того чтобы выбрать файлы в любом диалоге Windows в правильном порядке, нужно:

• Выделить щелчком мыши последний файл из выбираемых:

• Нажать клавишу Shift:

• Щелкнуть на первом из выбираемых файлов.

Открытие сканов занимает, в зависимости от быстродействия компьютера — от нескольких секунд до примерно полуминуты. Когда изображения открыты, можно просмотреть их в вертикальном графическом списке файлов, а имена сканов — перечисляются в левом верхнем углу окна. В списке имен наличие зеленой галочки рядом с именем файла — означает, что файл готов к финальной обработке (прошел стадию автоматической установки границ). В случаях, когда в файл вносятся изменения, и он требует повторной обработки, его имя выделяется полужирным шрифтом.


Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро. Иллюстрация № 9

2.2 Препроцессинг и расстановка границ

Каждая страница, обрабатываемая Кромсатором, перед основной обработкой проходит препроцессинг — первичную расстановку границ. При этом программа пытается определить положение корешка (при сканировании разворотов), обреза книги и полей страницы. Запускается препроцессинг командой Draft Kromsate меню Edit, или одноименной кнопкой (на кнопке — рисунок с ножницами) инструментальной панели.

При этом появляется диалог Draft Kromsate с тремя вкладками: Options, Preprocess и Advanced.

Собственно интерес будет представлять только вкладка Options, так как на ней выставляются все нужные на данный момент параметры. Список Kromsate позволяет выбрать, к каким файлам из списка будет применен препроцессинг. Опцию Pre-Rotate (вращение) следует использовать, когда развороты или страницы книги сканировались в «вертикальном» положении и не поворачивались программой сканирования. Флажок Save after rotate позволяет задать необходимость предварительного сохранения повернутого изображения (вот где важно отсутствие JPEG-сжатия!). Группа списков Use options from… задает возможность выбора одного из предварительно сохраненных наборов настроек.

Флажки в нижней части диалога задают параметры работы препроцессора, от них напрямую зависит качество результата, поэтому остановимся на них более подробно:

• Split Pages — задает разбиение разворотов на страницы. Включается в зависимости от формата книги и методики сканирования.

• Ignore blank half-page — разрешает программе самостоятельно исключать из обработки белые форзацы и просто страницы, не содержащие печати. Пригодится, если в книге есть отделение глав друг от друга белым листом.

• Safe top/bottom — установка этого флажка запрещает обрезку «полупустых» страниц и белых форзацев. Выключать не рекомендуется, особенно если книга предназначена для последующей распечатки — иначе не исключено наличие обрезанных не по формату «куцых» страниц.

• Бледный скан — вдвое снижает порог обнаружения контрастных границ текста и корешка. Применяется, если текст на скане очень бледен и трудно читаем (например, при сканировании различных руководств и многостраничных технических таблиц, напечатанных на полупрозрачной низкокачественной бумаге).


Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро. Иллюстрация № 10
• Skip marked files — запрещает повторную обработку файлов, отмеченных зеленой галочкой, то есть уже прошедших препроцессинг.

• Select special processed — выбирает в списке файлы, отмеченные полужирным шрифтом (имеющие специальные настройки).

• Set only cutters — задает возможность не совершать никаких действий, кроме расстановки границ.

• Don't set cutter near border — запрещает установку границы слишком близко от края изображения. Применяется, если книга сканировалась со слишком большим запасом по полям.

Если границы выставляются неправильно (чаще всего такое происходит на бледных сканах), может помочь увеличение чувствительности поиска вертикальных границ текста — она регулируется ползунком Text vert. sensitivity на вкладке Advanced.


Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро. Иллюстрация № 11
Когда все параметры выставлены, остается только нажать на кнопку ОК и подождать… от десяти минут до получаса, в зависимости от объема книги и быстродействия компьютера. После окончания
Litvek: лучшие книги месяца
Топ книга - Диверсант [Василий Иванович Сахаров] - читаем полностью в LitvekТоп книга - Дюна. Первая трилогия [Фрэнк Патрик Герберт] - читаем полностью в LitvekТоп книга - Sapiens. Краткая история человечества [Юваль Ной Харари] - читаем полностью в LitvekТоп книга - Кадетки [Вера Андреевна Чиркова] - читаем полностью в LitvekТоп книга - Эхо первой любви [Мария Воронова] - читаем полностью в LitvekТоп книга - Любовница ледяного дракона [Джейн Доу] - читаем полностью в LitvekТоп книга - Гении и аутсайдеры: Почему одним все, а другим ничего? [Малкольм Гладуэлл] - читаем полностью в LitvekТоп книга - Любимая предательница [Линн Грэхем] - читаем полностью в Litvek