Читаем Реферат, курсовая, диплом на компьютере полностью

<p>Глава 8</p><p>Сканирование, распознавание и конвертирование с помощью ABBYY FineReader</p>

В процессе написания работы вам наверняка будут встречаться тексты или рисунки из книг и журнальных статей, которые вам захочется поместить в свой документ. Если вы планируете использовать фрагмент, то его можно набрать повторно. Однако если вам нужны несколько страниц, гораздо лучше прибегнуть к другим способам работы с печатным текстом. Если у вас или у кого-то из ваших друзей есть сканер, можно сканировать нужный фрагмент, а затем вставить его в документ.

Процесс преобразования текста из бумажного вида в электронный состоит из нескольких частей. Первый этап – это сканирование документа. Однако если превращение бумажной картинки в электронную завершается на этапе сканирования, то превращение текста в электронный на этом этапе только начинается. В результате сканирования и фотографии, и текста будет получен графический файл.

Если вы захотите изменить полученный текст либо использовать только его часть, сделать это будет очень сложно. Дело в том, что графический файл представляет собой набор точек разных цветов, а текстовый файл – это набор символов. Чтобы в процессе сканирования получить текстовый документ, состоящий из символов, графический файл необходимо каким-то образом преобразовать в текстовый. Сделать это можно с помощью специальных приложений, называемых OCR-программами (OCR расшифровывается как Optical Character Recognition – оптическое распознавание символов).

Современные OCR-системы умеют распознавать печатный, а в некоторых случаях и рукописный текст на многих языках, могут сохранять полученный результат в удобном формате (например, в формате Word), исправлять погрешности сканирования, а также отделять текст от изображения. Наиболее популярными на сегодняшний день OCR-системами являются FineReader (http:// www.abbyy.com) и Cunei Form .

Системы распознавания текстов у опытных пользователей компьютеров ассоциируются в первую очередь с названием FineReader. Действительно, продукт фирмы ABBYY Software удобен, обеспечивает высокое качество распознавания, «понимает» около 200 языков и умеет различать даже листинги программ, написанные на некоторых языках программирования (например, Basic, C/C++, Java, Pascal).

В этой главе детально рассмотрим, как можно превратить бумажный текст в электронный с помощью программы FineReader (рис. 8.1).

Рис. 8.1. Окно программы FineReader

Процесс сканирования в FineReader осуществляется двумя способами. Вы можете воспользоваться услугами Мастера ScanRead, с помощью которого пройдете все четыре этапа преобразования документа бумажного вида в электронный (сканирование, распознавание, проверка и сохранение). Второй вариант – вручную пройти все эти шаги, выбирая соответствующие пункты меню либо используя кнопки панели инструментов.

После запуска FineReader и выбора режима работы программы (с помощью мастера или вручную) необходимо установить в сканер печатный документ. Для запуска процесса сканирования нажмите кнопку Сканировать либо выполните команду Файл -> Сканировать изображение.

После выбора способа сканирования откроется окно, в котором можно выполнить предварительный просмотр и установить необходимые параметры (рис. 8.2). Это окно для разных типов сканера имеет разный вид, но все же основные его параметры одинаковы. Расскажу о наиболее общих параметрах сканирования на примере использования сканера Mustek 1200 UB Plus.

Рис. 8.2. Настройка параметров сканирования

Обратите внимание на то, как вы размещаете источник в сканере. Постарайтесь добиться, чтобы книга или журнал лежали как можно ровнее, ведь если текст расположить неровно, он будет распознан неправильно и вам придется вручную исправлять много ошибок.

После того как вы указали параметры сканирования, можно выполнить предварительный просмотр страницы. Для этого необходимо нажать кнопку Preview (Предварительный просмотр). На этом этапе вы сможете увидеть, верно ли установлена страница в сканер, захватывает ли область сканирования весь текст или какая-то его часть остается за пределами. Затем вы можете поправить страницу в сканирующем устройстве, только потом не забудьте повторно предварительно ее просмотреть.

В левой части окна сканирования размещены вкладки и поля для настройки параметров. В списке Scan Mode (Режим сканирования) можно выбрать режим сканирования. Существует три варианта: цветной режим (Color (24 bit)), в оттенках серого (Gray) или сканирование текста (Lineart). Если вы собираетесь сканировать фотографии или изображение, советую выбрать первый или второй режим. Третий вариант идеально подходит для сканирования текста. Безусловно, вы можете задать цветной режим и при сканировании книги, но следует знать, что в этом случае результирующий файл будет занимать гораздо больше места, чем при сканировании в других режимах.

Перейти на страницу:

Похожие книги

3ds Max 2008
3ds Max 2008

Одни уверены, что нет лучшего способа обучения 3ds Мах, чем прочитать хорошую книгу. Другие склоняются к тому, что эффективнее учиться у преподавателя, который показывает, что и как нужно делать. Данное издание объединяет оба подхода. Его цель – сделать освоение 3ds Мах 2008 максимально быстрым и результативным. Часто после изучения книги у читателя возникают вопросы, почему не получился тот или иной пример. Видеокурс – это гарантия, что такие вопросы не возникнут: ведь автор не только рассказывает, но и показывает, как нужно работать в 3ds Мах.В отличие от большинства интерактивных курсов, где работа в 3ds Мах иллюстрируется на кубиках-шариках, данный видеокурс полностью практический. Все приемы работы с инструментами 3ds Мах 2008 показаны на конкретных примерах, благодаря чему после просмотра курса читатель сможет самостоятельно выполнять даже сложные проекты.

Владимир Антонович Верстак , Владимир Верстак

Программирование, программы, базы данных / Программное обеспечение / Книги по IT
Секреты приложений Google
Секреты приложений Google

Даже продвинутые пользователи Интернета не подозревают о тех огромных возможностях, которые предоставляют сервисы Google. Автор рассказывает о таких «секретах» сервисов, которые просто немедленно хочется использовать! Создавать сайты и презентации, бродить по улочкам Парижа, изучать звездное небо – все это доступно каждому, кто сидит у экрана монитора и имеет доступ в Интернет. Книга научит вас работать с веб-приложениями и тысячекратно увеличить свои возможности с помощью новейших технологий. Она написана легким, доступным языком и не требует от читателя наличия каких-либо специальных знаний. Книга содержит множество примеров, иллюстраций и будет полезна всем, кто не стоит на месте и стремится сделать свою жизнь более насыщенной и интересной.

Денис Балуев , Денис Игоревич Балуев

Программирование, программы, базы данных / Интернет / Программное обеспечение / Книги по IT
Самоучитель современного пользователя ПК
Самоучитель современного пользователя ПК

В самоучителе рассмотрены темы, актуальные для современного пользователя ПК: цифровое фото, запись, оцифровка, обработка и воспроизведение звуковых и видеофайлов; Web-камеры, запись компакт-дисков, а также сканирование и печать изображений, работа с дигитайзерами, подключение плазменных панелей и телевизоров к ПК. Для начинающих пользователей в необходимом объеме изложены основные сведения об устройстве компьютера и видах программ, описаны настройка и работа в инструментальных и сервисных программах (диагностика и проверка ПК, файловые менеджеры, программы-антивирусы и архиваторы). Дополнительно изложены вопросы восстановления работоспособности ПК. Рекомендуется широкому кругу читателей — начинающих пользователей и работающих на ПК, которые интересуются возможностями новой аппаратуры и программного обеспечения.

В. В. Мельниченко , Н. В. Калиниченко

Интернет / Компьютерное «железо» / ОС и Сети / Программное обеспечение