Читаем Как почистить сканы книг и сделать книгу полностью

Итак, инструмент Curves. Что, собственно, мы им сделаем? Это очень просто: разделим шум и полезное изображение по критерию яркости. Всё, что будет белее некоторого порога, станет максимально белым. Соответственно всё, что будет темнее некоторого порога, будет совершенно черным. Все наши усилия будут направленны как раз на установление этих порогов так, чтобы фон попал в белое, а текст – в черное. Имейте ввиду, если после предыдущих этапов обработки на изображении есть участки шума более темные, чем наиболее светлые участки текста, то Curves их не только не удалит, а наоборот – подчеркнет.

Вызываем Curves (Меню: Image -› Adjustments -› Curves или просто Ctrl-M). На Рис. 1 стрелками указаны две пипетки: "Уровень черного" и "Уровень белого". Орудуя ими по очереди мы и подгоним пороги так, чтобы текст было побольше, а шума поменьше. Серая пипетка нам не нужна. Кнопка в правом нижнем углу (подсвечена желтым) увеличивает окошко или делает его компактным.

Рис. 1

Перед вызовом Curves нужно увеличить изображение на весь экран так, чтобы были целиком видны 3-4 буквы. Обязательно должна попасть точка и запятая, буквы с мелкими деталями. Лучше выберите сильно зашумленный участок, там где шум более темный. По возможности выберите участок с мелким шрифтом, например текст сноски внизу страницы.

Теперь по очереди, чередую пипетки, щелкайте на белой – на участках с шумом, черной – на полезных участках картинки, на буквах.

Когда будет работать пипетками, контролируйте следующие критерии, они выбраны с учетом характерных ошибок FineReader'а:

– точка "." и запятая "," должны отличаться;

– белый участок внутри букв "е", "о", "R" и т.п не должен быть залит черным;

– мелкие детали букв должны быть различимы, например хвостик у курсивной "а", она не должна превращатся в "о";

– следите за "коромыслом" у буквы "й", точкой над "i" и другими подобными элементами букв;

– обратите внимание на верхние (и нижние) индексы, например значки и цифры, указывающие на сноску;

– мелкие разрывы в вертикальных участках широких букв – "м", "ш" – не страшны;

– в горизонтальных/наклонных участках букв "н", "и", "п" разрывов быть не должно. FR немедленно начинает их путать;

На рисунках 2-6 показаны скриншоты последовательной настройки уровней белого ичерного. Пипетка выделена овалом. Розовым – черная, желтым – белая.

Рис. 2Рис. 3Рис. 4Рис. 5Рис. 6

Когда настроите Curves, сохраните профиль: "Save…". Он будет использован потом, при пакетной обработке остальных страниц.

Вот что получилось:

Рис. 7

В начале первой части статьи я говорил о том, как влияет очистка изображения на степень сжатия. Посмотрите как последовательно уменьшаются размеры картинок от 2-й до 7-й. С 8806 байт до 1376. Это хорошая иллюстрация к упомянутому утверждению.

Теперь надо записать Action, чтобы автоматически обработать Фотошопом остальные страницы. В нем будет всего две команды:

1) Curves, c ранее сохраненным профилем;

2) Image -› Mode -› Bitmap…

Выскочит окошко Bitmap.

В строке "Resolution" оставьте как есть – 600dpi.

В строке "Metod" выберите "50% Threshold".

Можно сначала попробовать Threshold отдельно, до записи скрипта, чтобы посмотреть, что получилось. Если вам покажется лучше другой уровень Threshold, не 50%, вставьте его в Action отдельной командой, сразу после Curves.

Запускать пакетную обработку в Фотошопе, надеюсь, все умеют? Если нет, то у Фотошопа есть Help…

Следующая, 3-я, часть статьи будет посвящена работе с фильтром Smart Blur.

Может быть, я добавлю туда материалы по некоторым другим способам обработки изображений. А может быть и нет, как со временем будет

<p>Часть 3</p>

Это окончание статьи.

В третьей части я расскажу о фильтре Smart Blur и сделаю краткие выводы по всем 3-м частям статьи.

Пояснения к картинке в начале статьи (в анонсе)

Я сделал эту картинку для того, чтобы наглядно показать разницу между Smart Blur и просто Blur (Меню Filter -› Blur -› Blur more). На 3-D картинке (вверху) яркость пикселей отображена в виде трехмерного рельефа. "Щебень" у подножия горы справа – это шум. Исходное 2-D изображение внизу. Оно ивертировано, для наглядности 3-D картинки. 3-D картинка делалась в Pov-ray.

Photoshop: Smart Blur

Вы найдете этот фильтр в меню Filter -› Blur -› Smart Blur.

Smart Blur переводится как "умное сглаживание". В научной литературе для таких фильтров обычно применяют название адаптивный – adaptive blur, adaptivethresholding и т.п. Аналогичные фильтры есть и в других программах обработки изображения. Ищите названия со словами adaptive, denoiser и т.п. В Paint Shop Pro v9.1 схожий фильтр называется Edge Preserving Smooth (Размытие с защитой краев).

Перейти на страницу:

Похожие книги

1С: Бухгалтерия 8 с нуля
1С: Бухгалтерия 8 с нуля

Книга содержит полное описание приемов и методов работы с программой 1С:Бухгалтерия 8. Рассматривается автоматизация всех основных участков бухгалтерии: учет наличных и безналичных денежных средств, основных средств и НМА, прихода и расхода товарно-материальных ценностей, зарплаты, производства. Описано, как вводить исходные данные, заполнять справочники и каталоги, работать с первичными документами, проводить их по учету, формировать разнообразные отчеты, выводить данные на печать, настраивать программу и использовать ее сервисные функции. Каждый урок содержит подробное описание рассматриваемой темы с детальным разбором и иллюстрированием всех этапов.Для широкого круга пользователей.

Алексей Анатольевич Гладкий

Программирование, программы, базы данных / Программное обеспечение / Бухучет и аудит / Финансы и бизнес / Книги по IT / Словари и Энциклопедии
1С: Управление торговлей 8.2
1С: Управление торговлей 8.2

Современные торговые предприятия предлагают своим клиентам широчайший ассортимент товаров, который исчисляется тысячами и десятками тысяч наименований. Причем многие позиции могут реализовываться на разных условиях: предоплата, отсрочка платежи, скидка, наценка, объем партии, и т.д. Клиенты зачастую делятся на категории – VIP-клиент, обычный клиент, постоянный клиент, мелкооптовый клиент, и т.д. Товарные позиции могут комплектоваться и разукомплектовываться, многие товары подлежат обязательной сертификации и гигиеническим исследованиям, некондиционные позиции необходимо списывать, на складах периодически должна проводиться инвентаризация, каждая компания должна иметь свою маркетинговую политику и т.д., вообщем – современное торговое предприятие представляет живой организм, находящийся в постоянном движении.Очевидно, что вся эта кипучая деятельность требует автоматизации. Для решения этой задачи существуют специальные программные средства, и в этой книге мы познакомим вам с самым популярным продуктом, предназначенным для автоматизации деятельности торгового предприятия – «1С Управление торговлей», которое реализовано на новейшей технологической платформе версии 1С 8.2.

Алексей Анатольевич Гладкий

Финансы / Программирование, программы, базы данных