Читаем Итоги № 36 (2013) полностью

Как рассказывает Елена Тихонова, замгендиректора по библиотечной работе Российской национальной библиотеки (РНБ), формирование электронных коллекций библиотек как раз и начиналось с оцифровки старинных книжных изданий, отражающих историю и культуру России. Например, на сайте РНБ можно увидеть уникальный книжный памятник — Лаврентьевскую летопись 1377 года, полностью соответствующую оригиналу вплоть до текстуры бумаги и тона краски, да еще с научными комментариями ведущих специалистов. Региональные партнеры Национальной электронной библиотеки (НЭБ), задуманной как единый портал, интегрирующий библиотечные ресурсы России в единую информационную сеть, передают в НЭБ коллекции, среди которых преобладает краеведческая литература. В рамках совместного проекта РНБ и столичной Российской государственной библиотеки (РГБ) выполняется масштабный проект «Русская классика», охватывающий литературные произведения XVIII — первой половины XX веков. Уже оцифровано свыше 12 тысяч классических произведений 86 авторов: от мировых звезд до литераторов меньшей величины. Только компания «ЭЛАР», по оценкам директора по маркетингу Павла Плотникова, ежегодно отправляет российским библиотекам более сотни комплектов профессионального оборудования для оцифровки книжных оригиналов стоимостью от сотен тысяч до миллионов рублей.

Но вот в чем проблема: во всем мире стандартом де-факто для оцифровки книг является формат PDF — большинство созданных к сегодняшнему дню электронных версий библиотечных книг представляет собой набор отсканированных картинок страниц. Для редких и ветхих экземпляров это, безусловно, отличный вариант, а вот для анализа, скажем, «Войны и мира» школьниками и аспирантами картинки недостаточно. Поэтому сегодня создаются PDF-книги с контекстным поиском (двухслойный файл, в котором графические изображения страниц дополняются автоматически распознанным текстом, но без его верификации) и полнотекстовые электронные книги, полностью идентичные бумажному оригиналу. Чтобы получить такой электронный вариант, с распознанным текстом работают люди — профессиональные корректоры. Именно такую цель — создание эталонной электронной версии преследует проект «Весь Толстой в один клик», начатый два месяца назад, рассказывает Григорий Липич, генеральный директор компании ABBYY Россия, предоставляющей тысячам добровольных помощников ПО автоматического распознавания текстов: «Полное собрание сочинений будет доступно в формате PDF с распознанным текстовым слоем под картинкой и в наиболее популярных форматах электронных книг ePub и fb2». Надо сказать, что волонтеры для таких задач везде в почете.

«До четверти трудозатрат по обслуживанию Нью-Йоркской публичной библиотеки приходятся на волонтеров,— рассказывает Саттар Гюльмамедов, руководитель центра разработки ПО WEXLER.— Там ведь та же ситуация, что и у нас, — оцифровкой книг библиотеки США занимаются в рамках своих бюджетов с помощью коммерческих организаций». Между тем технический прогресс будет идти дальше. «Я не знаю, какие технологии будут доступны через 100 лет, но сейчас мы поступаем так, чтобы после обработки 90-томника у нас помимо форматов PDF, ePub и fb2 также сохранился некий канонический и выверенный материал в виде размеченного текста и иллюстраций, что позволит в будущем создавать представления электронных книг в новых форматах»,— рассказывает Григорий Липич.

По сути, каждая организация, которая берется сегодня за оцифровку книги, изобретает свой велосипед, ведь единых стандартов этого процесса, регламентов и требований к качеству нет. Нет единых форматов и стандартов хранения, защиты от внесения изменений, а также регламента инвентаризации и учета оцифрованных произведений. «Есть правила бумажного комплектования, но на электронные копии эти правила не распространяются,— сетует Павел Плотников.— Библиотеки решают эти задачи самостоятельно и в зависимости от своей продвинутости». И так обстоит дело не только у нас. Еще только идет разработка международного стандарта ISO в части оцифровки материалов исторического и культурного наследия.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже