Комплекс ОРФО включает модули проверки русской орфографии и грамматики для программ семейства Microsoft Office, а также Adobe PageMaker, Corel WordPerfect, Lotus WordPro и QuarkXPress. Полезность ОРФО при использовании совместно с нелокализованными продуктами очевидна и пояснений в этом случае не требуется. Однако оказывается, что и при работе с локализованными продуктами ОРФО способен изрядно облегчить жизнь тем, чья профессия связана с обработкой текстов. В любом случае, после работы с ОРФО вы уже не сможете смотреть на встроенные системы проверки орфографии иначе, как со снисходительной жалостью. Сравним ОРФО хотя бы с орфографическим модулем того же Word (который был также создан компанией «Информатик»... целых девять лет назад!). Очевидно, что ОРФО может распознать гораздо больше слов, а в случае обнаружения ошибок – еще и предложить значительно больше вариантов их исправления. А вот и принципиальное новшество: ОРФО позволяет добавлять незнакомые слова в словарь вместе со всеми словоформами! Для этого вам достаточно правильно указать грамматические категории слова (т. е. его род, тип склонения и т. д.). В итоге, в дальнейшем будет правильно распознаваться не только конкретная форма введенного слова (например, «плагинов»), но и все остальные («плагины», «плагинами»...). Если бы вы работали со стандартным модулем Word, то каждую форму необходимо было бы указывать отдельно. При этом пользовательский словарь, созданный вами в одном приложении, будет доступен и при работе с другими пакетами, способными работать совместно с ОРФО.
Новые версии программы (начиная с профессиональной версии ОРФО-2002) поддерживают и подключение дополнительных, специализированных словарей (или «словников»), которые вы можете приобрести отдельно:
■ Научный словник. Содержит 25 тыс. слов из области математики, физики, химии, информатики, биологии, лингвистики.
■ Технический словник. Содержит 23 тыс. общетехнических слов и терминов из области авиа-, ракето– и автомобилестроения, нефтегазовой, радиотехнической, пищевой и парфюмерной промышленности.
■ Медицинский словник. Содержит 13 тыс. слов из области медицины.
■ Гуманитарный словник. Содержит 3 тыс. слов из области культуры, религии, политики, музыки, психологии.
■ Словник по бизнесу. Содержит 2 тыс. терминов по бизнесу, бухучету, финансам и праву.
Наконец, помимо орфографического модуля в профессиональную версию ОРФО дополнительно включены: Толковый словарь и Грамматический справочник, Составление реферата и списка ключевых слов, Поиск и замена слов во всех формах, подробная Справочная система, макрокоманда Расстановки всех возможных переносов и др.
FineReader – распознавание текста
Ввести со сканера текст в компьютер – задача не слишком трудная. Однако работать с таким текстом невозможно: как и любое сканированное изображение, страница с текстом представляет собой графический файл – обычную картинку. Отсюда возникают проблемы: во-первых, в графическом формате страница занимает слишком много места, и, скажем, отсканированная книга не на каждый жесткий диск поместится. И вторая, самая главная проблема: сканированный текст можно будет только читать, но не редактировать и не вставлять его фрагменты в создаваемый вами документ. Ведь сам сканер распознавать буквы именно как буквы не умеет: они для него – всего лишь пятна и точки черного цвета.
К счастью, на свете существуют программы, способные перевести сканированный текст из графического в текстовый формат – программы распознавания текста или OCR.
Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами (именно так работали распознавалки первого поколения), но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное – корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст – это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата – скажем, формата Microsoft Word или Excel.
Как видим, для того чтобы получить электронную, готовую к редактированию копию любого печатного текста, программе OCR необходимо выполнить «цепочку» из множества отдельных операций: