Читаем Интернет-журнал "Домашняя лаборатория", 2008 №3 полностью

Во время кодирования, VPP проверяет страницы всего документа, пытается найти повторяющиеся формы и на основе анализа создает общий "словарь" этих форм. Так как "словарь" таких форм можно использовать для всех остальных страниц, то размер файла djvu и затраченное время на кодирование резко уменьшаются. Можно устанавливать размер "словаря" форм от 1 до 10000 страниц, по умолчанию это значение равно 20, что достаточно для большинства случаев.

Подбор этого значения производится приблизительно так: меньшие значения при большом количестве страниц приводят к увеличению количества "словарей" форм. Например, если кодируемый документ содержит 100 страниц, а значение устанавливается равным 5, то VPP создаст 20 общих "словарей". При открытии djvu файла, программа просмотра может обработать эти 20 "словарей" достаточно быстро, поскольку они небольшие и открытие файла будет без задержек. С другой стороны, если на 100 страниц установить значение "словаря" в 50 страниц, то VPP создаст всего два "словаря", при этом размер файла уменьшится, но увеличится время на его открытие при просмотре, поскольку сами "словари" будут иметь большие размеры. Оптимальное значение выбирается равным приблизительно одной пятой от количества страниц в документе и может уточняться экспериментально.


Сжатие маски Foreground compression

Может принимать значения: Lossless, Quasi Lossless, Conservative, Lossy, Aggressive — Без потерь, Почти без потерь, Консервативное, С потерями, Агрессивное. Обычно бывает нужно использовать только первый и последний пункт, вот их характеристики:

• Lossless является кодированием без потерь, использует разделение маски и фона, применяется почти во всех случаях для черно-белых документов. Если использовался какой-либо другой режим и появились искажения, типа отсутствия точек над "i" или же черно-белое изображение слишком смазано, то лучше всего будет переключиться на Lossless;

• Aggressive является полной противоположностью Lossless, при его использовании делается попытка удаления шума из маски, размер файла в этом случае минимален, его следует использовать только в том случае, если есть гарантия получения качественного djvu файла;

Для остальных режимов даны такие рекомендации:

 Quasi Lossless более умеренный режим, чем Conservative, но с большими потерями, чем при Lossless;

 Conservative вносит изменения в текст, хотя не такие серьезные, обычно они незаметны;

• Lossy, режим с максимальными потерями, обеспечивает наименьший размер djvu файла, но применять его следует с большой осторожностью, вероятность ошибок "и" и "н" и т. д., очень высокая.



Качества фона Background Quality

Определяет размытость фона в документе, более высокие значения уменьшают размытость, особенно на фотографиях, но увеличивают размер файла, меньшие наоборот. Если ставится задача сохранения документа как архивного, то качество фона выбирается близким к максимальному, в районе 95, чтобы получить практическое отсутствие потерь при кодировании. Для вебстраниц можно выбрать меньшее значение, приблизительно равное 75. Еще меньшие значения применяются, если фон документа не содержит различных цветов или не ставится задача сохранения максимального качества оригинала.


Коэффициент субвыборки фона Subsampling Factor

Этот параметр позволяет уменьшить количество пикселей в фоновом слое djvu документа и уменьшить его размер. Обычно фоновые объекты могут кодироваться с меньшей четкостью и контрастностью без ухудшения общего вида. Установка производится в закладке "Background" меню "Advanced". Значения могут быть установлены от 1 до 10, примерное значение выбирается в зависимости от разрешения. Если разрешение документа djvu равно 300 dpi, то коэффициент субвыборки устанавливается равным одной трети от него, то есть, равен 3, при этом фон будет иметь всего 100 dpi, что вполне приемлемо. При этом размер конечного файла уменьшается, но текст, если он содержится в фоне, все равно останется читаемым. Так как фоновые объекты будут выглядеть размазанными при разрешении меньшем 100 dpi, то коэффициент субвыборки фона равный 1 или 2 выбирается только при общем разрешении документа менее 100 dpi или когда фон не содержит различных цветов.



Порог разделения между маской и фоном Separation Threshold

Перейти на страницу:

Похожие книги