Читаем Журнал «Компьютерра» № 33 от 12 сентября 2006 года полностью

Это не новшество, то же самое делала и первая версия. Но теперь у программы появился некий интерфейс, который можно вызвать, если выбрать «конвертировать, используя пользовательские настройки». В этом случае пред вашим взором предстанет чудное окошко (рис. 4), где в левой части можно видеть странички PDF-файла, а в правой — «куда ставить-то», то есть формат, параметры конвертации и папку для итогового файла. Вся прелесть этого режима в том, что можно не только собственноручно выбирать области распознавания (выбрасывая, например, колонтитулы) и их тип [Это особенно важно для выбора таблица/картинка, так как некоторые картинки с регулярными прямоугольниками (графики) программа объявляет таблицей], но и порядок распознавания блоков (рис. 5), что особенно помогает, когда файл представляет собой сложный многоколоночный текст.

Варианты сохранения оформления документов

Так как появилась возможность манипулировать блоками, разработчики реализовали некоторые характерные сценарии преобразования в виде отдельных опций. При сохранении в формате Microsoft Excel можно, например, выбрать «Игнорировать текст вне таблицы», и тогда будет конвертирована только информация из блоков-таблиц. Это особенно полезно, если, скажем, нужно преобразовать в Excel PDF-прайс-лист какой-нибудь компании без логотипов и печатей.

Интеллектуальное преобразование PDF-файлов

Очень необычное, но важное нововведение. Некоторые сетевые сканеры со встроенными системами распознавания текста создают так называемые Searchable PDF. В нем имеется дополнительный невидимый слой, в который помещается распознанный текст. Если программа находит такой слой, то она чаще всего использует его, не тратя время на процесс распознавания. С другой стороны, содержимое этого слоя не всегда соответствует оригиналу, особенно если он содержит фрагменты на языках, не поддерживаемых OCR сканера. «Трансформер» проводит экспресс-анализ и для каждого абзаца принимает решение: извлечь текст из невидимого слоя или распознать изображение и получить текст заново.

Преобразование PDF-файлов с нестандартными шрифтами

Если в свойствах PDF-файла указаны нестандартные шрифты, то при «вытягивании» текста обычным образом вы получите «кракозябры» вместо букв. Для решения этой проблемы во второй версии появилась галочка «конвертировать как изображение» (рис. 6), что позволяет заново распознать весь текст даже в необычных шрифтах. В итоге вы получите распознанный текст в наиболее похожем стандартном шрифте Windows…

ОГОРОД КОЗЛОВСКОГО: α

Автор: Козловский Евгений

То тут, то там, и в Москве, и в Питере, эффектно сделанные черные рекламные плакаты новой (первой!) сониевской цифровой зеркалки α (альфа) просто не могли не броситься мне в глаза и запорошили их настолько, что я забыл кучу новостных сообщений и пресс-релизов по поводу происхождения этого аппарата и загорелся идеей протестировать новинку. И только когда, обратившись по этому поводу в московское представительство Sony, встретился там с Андреем Кургановым, — все сразу и вспомнил: и про перекупку Sony зеркалок у отказавшейся от фоторынка Konica Minolta, и о том, что полтора года назад уже встречался с Андреем Кургановым — правда, еще в офисе Konica Minolta — и брал у него на тестирование аппарат Dynax 7D, который и описал в «Огороде» "Тренировочные стрельбы", и даже о том, что пресловутая α 100 — это не что иное, как даже не дочка, а скорее младшая сестрица того самого Dynax 7D. Отличия, однако, должны были быть (и оказались на самом деле), так что от идеи тестирования (скорее, конечно, — составления впечатления) я не отказался, о чем нисколько и не жалею.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже