Читаем Неизведанная территория полностью

Поначалу мы считали, что шансы на это велики. Оцифровка старых газет приобрела значительные масштабы. К настоящему времени ведущие газеты вроде New York Times, Boston Globe и многих других уже полностью оцифровали свои архивы. Национальный фонд гуманитарных наук профинансировал оцифровку старых американских газет – около шести миллионов страниц, отражавших историю целого столетия. Прогрессировали и другие страны. В рамках одного лишь проекта Australia’s Trove было оцифровано около ста миллионов газетных статей. Этой деятельностью в течение какого-то периода занималась и Google, оцифровав архивы двух тысяч газет[201].

Однако, несмотря на эти впечатляющие шаги, никакие усилия по оцифровке газет не сопоставимы по масштабу и покрытию с книжным проектом Google.

Идеальным примером этого неравенства может считаться «кругосветный розыгрыш» По. Найти цифровое издание этого розыгрыша несложно. Однако это связано с успехом оцифровки книг, а не газет. Хвост этой истории настолько велик, что рассказ о ней возникает во множестве книг, описывающих жизнь и работу По. Эти книги, как и книги самого По, уже были оцифрованы.

Однако вам не удастся найти цифровую копию газеты, которая изначально опубликовала эту историю. Национальный гуманитарный фонд профинансировал оцифровку выпусков нью-йоркской газеты Sun лишь за период с 1859 по 1920 год. Розыгрыш, опубликованный в 1844 году, оказывается очередным «белым пятном» в процессе оцифровки газет. Основная масса газетных статей, написанных По, не оцифрована, и никто не знает, когда это будет сделано.

Неопубликованные тексты. Книгопечатание представляет собой сравнительно недавнее изобретение. До появления печатного станка тексты распространялись в виде рукописей, написанных и скопированных от руки. В наши дни множество прекрасных текстов выживает лишь в этой форме. Многие знаменитые рукописи, наподобие манускриптов Мертвого моря, уже были оцифрованы, также как и другие важные коллекции, например греческие рукописи в Британской библиотеке. Однако систематические усилия по оцифровке рукописей предпринимаются лишь на местном уровне[202].

Разумеется, создание неопубликованных текстов не остановилось с появлением книгопечатания. После По осталось 422 письма. В его случае письма были оцифрованы, однако история напоминает то, что приключилось с его «кругосветным розыгрышем»: письма По подверглись цифровой обработке только потому, что он был очень знаменит и они упоминались во множестве источников. Другие материалы самого По и других авторов о нем были оцифрованы в рамках любительских проектов (например, проекта Austin’s Harry Ransom Center в университете штата Техас). В университете можно найти цифровые изображения отдельных рукописей По, адресованных ему писем и некоторых незаконченных произведений. Образ Эдгара Аллана По можно увидеть даже на карточках-вкладышах в сигаретные пачки. До наступления тех времен, когда определенную культурную нишу в США заняли карточки с изображениями бейсболистов, многие актеры, модели и писатели вносили свой посильный вклад в стимулирование продаж табака.

Но когда речь заходит о неопубликованном материале, наследие По оказывается значительно менее репрезентативным. Люди вроде него имеют звездный статус. Почти все, связанное с ними, будет найдено и оцифровано. А что насчет всех остальных? Заметки, журналы и переписка 99% других людей пылится на чердаках и в старых сундуках. Разобраться с ними крайне сложно, и усилия по их оцифровке представляют собой редкие исключения.

Один из немногих примеров успешной попытки разобраться с материалом такого рода был предпринят Афсане Наджамбади, преподавательницей из Гарварда, изучающей иранских женщин. Она буквально ходила от двери к двери в иранских городах, спрашивая жителей о том, не сохранились ли у них какие-нибудь исторические документы, связанные с жизнью женщин. Затем она тщательно создавала цифровые образы всего, что удавалось найти. Результат – архив под названием «Миры женщин в Иране при династии Каджаров» – открыт в свободном доступе по адресу: http://www.qajarwomen.org. Это настоящая сокровищница всего, от завещаний до почтовых открыток и брачных контрактов. Подобные сокровища имеются во всех обществах. Однако время медленно убивает их.

И, как ни печально, для остановки этого процесса не предпринимается никаких систематических усилий.

Перейти на страницу:

Все книги серии Наука XXI век

Неизведанная территория
Неизведанная территория

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Жан-Батист Мишель , Эрец Эйден

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература

Похожие книги

Искусство статистики. Как находить ответы в данных
Искусство статистики. Как находить ответы в данных

Статистика играла ключевую роль в научном познании мира на протяжении веков, а в эпоху больших данных базовое понимание этой дисциплины и статистическая грамотность становятся критически важными. Дэвид Шпигельхалтер приглашает вас в не обремененное техническими деталями увлекательное знакомство с теорией и практикой статистики.Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики.На русском языке публикуется впервые.

Дэвид Шпигельхалтер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
От болезни тела – к исцелению души. Почему мы болеем?
От болезни тела – к исцелению души. Почему мы болеем?

Все болезни имеют глубокий смысл. Они передают ценнейшие послания психики. Психолог Торвальд Детлефсен и врач Рудигер Дальке помогают нам понять, о чем свидетельствуют инфекционные заболевания, головные боли, несчастные случаи, сердечные приступы и желудочные колики, а также рак и СПИД. Если вы осознаете картину собственной болезни, то сможете найти новый прямой путь к самому себе. Болезнь не является неприятной помехой на этом пути, ибо она сама – путь. Чем сознательнее мы к ней относимся, тем лучше она выполняет свои задачи. Наша цель – не борьба с болезнью, а ее использование для исцеления души.

Рудигер Дальке , Торвальд Детлефсен

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Эзотерика / Здоровье и красота / Дом и досуг