Далее устанавливаем необходимые языки распознавания, как правило "Русский и английский" вполне достаточно. Но если вы работаете, например, с английским изданием, где не встречает кириллица, то соответственно выбираем только английский язык (данный шаг позволит ускорить процесс распознавания). После чего нажимаем кнопку "ОК".
Далее нажимаем кнопку "Распознать".
Для распознавания сразу всех страниц необходимо нажать на сочетание клавиш "Ctrl+Shift+R" или нажимаете на стрелку "т
", находящуюся слева от кнопки"Распознавать", далее в ниспадающем меню выбираем "Распознать все".
Если у вас распознанный документ, то можно сохранить данные… в различные текстовые форматы. Для этого нажмите сочетание клавиш "Ctrl+S" или через меню «Файл» выберите "Сохранить страницы".
После сохранения изображения не забудьте сохранить сам проект в "пакет" (сохраняйте, если захотите продолжить проект в будущем; а также после 100 отсканированных страниц, во избежание порчи проекта). Из меню файл, выбираем пункт "Сохранить пакет как".
После чего выбираем имя и сохраняем.
Данная программа предназначена для создания DjVu файлов.
DjVu — графический формат, оптимизированный для хранения отсканированных документов. В частности он идеально подходит для создания электронных книг.
Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литературы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы.
РАБОТА С ПРОГРАММОЙ
Для открытия файла нажмите на иконку или сочетание клавиш "Ctrl+O", так же файл можно открыть из верхнего меню (см. рисунок).
Выберем «Тип файлов».
После чего появится диалоговое окно, в котором необходимо выбрать формат файла (в нашем случае tiff).
Мы увидим все файлы этого типа и сможем выбрать, и открыть необходимый — кнопкой «Открыть».
Файлы указанных типов получаются при сканировании странниц книг. Сканирование можно делать этой же программой, но практика показывает, что делает она это не очень быстро. Лучше воспользоваться какой-нибудь другой программой, например: VueScan, Irfan View, XnView. He следует использовать для этого программу FineReader, поскольку она неаккуратно делает выпрямление косых сканов, из-за чего на изображении появляются изломы, которые ухудшают просканированный текст.
Зачастую вам приходится изготавливать DjVu-файл из нескольких файлов. В этом случае при добавлении новых файлов, вам необходимо выделить страницу после (или до которой) необходимо вставить файл(ы). Для примера вставим еще один любой файл в конец проекта, для этого выделяем последний файл, как показано на рисунке.
После чего в верхнем меню выбираем "Правка" —> "Добавить страницы после", появляется окно аналогичное в 1 шаге, где вы и выбираете нужный файл.
Для сохранения файла нажмите на значок или сочетание клавиш "Ctrl+S", а так же с помощью верхнее меню (см. рисунок).
После чего отмечаем: сохранять страницы "Вместе". Если у вас полная версия программы (дистрибутив более 40 Мb), то возможно распознавание текста, для этого поставьте галочку рядом с "OCR" (распознавание текста, точнее вставку текстового слоя, можно провести и с помощью программы DjvuOCR, которая работает в комплексе с программой ABBYY FineReader 7, последняя делает распознавание гораздо лучше). Далее распознавание документа будет рассмотрено более подробно в шаге 4.
Например:
"Нормальный" — в большинстве случаев можно использовать его (в основном для книг, для рукописи использовать не рекомендуется)
"Черно-белый" — выбирайте, если материал хорошего качества, и большая часть книжный текст (рекомендуется для книг и различный буклетов)
"Рукопись" — подходит для лекций и др.
Распознавание так же возможно непосредственно в программе Document Express Editor.