Читаем Программа обработки текста после сканирования AfterScan полностью

Программа обработки текста после сканирования AfterScan

Описывается работа с программой AfterScan, которая умеет исправлять ошибки автоматически.Т.к. в документе имеется таблица, рекомендуется использовать fb2-читалку Cool Reader 3

Cadet Bigler

Программирование, программы, базы данных18+

Программа обработки текста после сканирования AfterScan

В прошлой главе, рассматривая работу программы оптического распознавания текста FineReader, мы увидели, что текст после сканирования и распознавания нуждается в корректировке, и чем сложнее форматирование текста и чем больше его объем, тем больше усилий придется затратить, чтобы привести его к приемлемому для дальнейшей работы виду.

Программа FineReader и текстовый процессор Word предоставляют мощные и разнообразные средства для решения этой задачи, но изрядную часть работы все-таки приходится делать вручную. Существует не очень известная в России программа AfterScan, которая в ряде случаев способна выполнить корректировку отсканированного текста автоматически. Эта программа может использоваться для обработки и правки текстов больших объемов, введенных с клавиатуры или полученных при помощи программ оптического распознавания текстов, причем для эффективной работы программы важно знать, каким именно способом получен текст.

Авторы программы утверждают, что в ее основе лежат алгоритмы, позволяющие анализировать и исправлять ошибки и опечатки практически любых типов, причем в отличие от программы проверки грамматики Word, программа AfterScan может исправлять ошибки и опечатки самостоятельно.

Рассмотрим эту программу более подробно.

Программа AfterScan выпускается в четырех версиях

AfterScan Express - shareware-версия для домашнего пользования;

AfterScan Professional - для издательств и компаний;

AfterScan Antique - для обработки текстов в старорусской орфографии и перевода его в современную орфографию;

AfterScan Webmaster - для пакетной обработки большого числа документов, например, для обработки текстов, размещаемых на Web-сайтах.

Различия между функциональными возможностями различных версий программ видны из таблицы:


Обработка текстовExpressProfessionalAntiqueWebmaster
Обработка ошибок OCR
Обработка ошибок ручного ввода
Обработка старорусских текстов
Перевод старорусских текстов в современную орфографию
Чистка пунктуации
Чистка отступов и пробелов
Обработка латинских букв в русских словах
Восстановление специальных символов других языков
Восстановление римских цифр
Обнаружение сокращений и аббревиатур
Обнаружение математических и химических формул
Обнаружение HTML-тегов и скриптов
Склейка слов с переносами
Склейка слов с отбивкой пробелами
Поиск новых слов в нескольких файлах
Прочие функции
Функция переформатирования текстов
Улучшенный диалог поиска и замены
Поддержка словаря пользователя и редактор
Ручная защита фрагментов текста от изменений
Сохранение Журнала вместе с документом
Пакетная обработка большого числа файлов
Пакетная конверсия формата файлов
Цена (на момент написания книги, для граждан СНГ, рублей)30080015002100


Программа AfterScan Express - условно бесплатная[1], ее оценочную версию, которая будет работать в течение 30 дней, можно загрузить с сайта программы по адресу: http://http://www.futura.ru/hg/ase51en.exe[2] (для английских текстов), размер файла - 2,9 Мб. На момент написания книги на сайте разработчиков была выложена сборка программы за номером 023.

Установка программы никаких проблем не составляет. Достаточно запустить загруженный файл и следовать указаниям инсталлятора. Программа не требует настройки и готова к использования сразу после установки. Если вы приобрели версию программы Professional, Antique или Webmaster, то при первом запуске программы потребуется ввести личный идентификатор пользователя. Для версии Express это не нужно.

Личный идентификатор пользователя - это число, которое используется для отслеживания версий грамматик программы AfterScan индивидуально для каждого пользователя.

Перейти на страницу:

Похожие книги

Разработка приложений в среде Linux. Второе издание
Разработка приложений в среде Linux. Второе издание

Книга известных профессионалов в области разработки коммерческих приложений в Linux представляет СЃРѕР±РѕР№ отличный справочник для широкого круга программистов в Linux, а также тех разработчиков на языке С, которые перешли в среду Linux из РґСЂСѓРіРёС… операционных систем. РџРѕРґСЂРѕР±но рассматриваются концепции, лежащие в основе процесса создания системных приложений, а также разнообразные доступные инструменты и библиотеки. Среди рассматриваемых в книге вопросов можно выделить анализ особенностей применения лицензий GNU, использование СЃРІРѕР±одно распространяемых компиляторов и библиотек, системное программирование для Linux, а также написание и отладка собственных переносимых библиотек. Р

Майкл К. Джонсон , Эрик В. Троан

Программирование, программы, базы данных
Фундаментальные алгоритмы и структуры данных в Delphi
Фундаментальные алгоритмы и структуры данных в Delphi

Книга "Фундаментальные алгоритмы и структуры данных в Delphi" представляет СЃРѕР±РѕР№ уникальное учебное и справочное РїРѕСЃРѕР±ие по наиболее распространенным алгоритмам манипулирования данными, которые зарекомендовали себя как надежные и проверенные многими поколениями программистов. По данным журнала "Delphi Informant" за 2002 год, эта книга была признана сообществом разработчиков прикладных приложений на Delphi как «самая лучшая книга по практическому применению всех версий DelphiВ».Р' книге РїРѕРґСЂРѕР±но рассматриваются базовые понятия алгоритмов и основополагающие структуры данных, алгоритмы сортировки, поиска, хеширования, синтаксического разбора, сжатия данных, а также многие другие темы, тесно связанные с прикладным программированием. Р

Джулиан М. Бакнелл

Программирование, программы, базы данных