Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.
Жан-Батист Мишель , Эрец Эйден
Базы данных / Книги по IT18+Эрец Эйден, Жан-Батист Мишель
Неизведанная территория
Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Моему папе, который всегда верил, что я умею считать
Моей семье
Erez Aiden and Jean-Baptiste Michel
Uncharted: Big Data as a Lens on Human Culture
Исключительные права на публикацию книги на русском языке принадлежат издательству AST Publishers. Любое использование материала данной книги, полностью или частично, без разрешения правообладателя запрещается.
Глава 1
Зазеркалье
Давайте представим, что у нас есть робот, способный прочитать каждую книгу на каждой полке всех крупных библиотек мира. Он может их прочесть невероятно быстро и запомнить каждое прочитанное слово в своей бесперебойно работающей памяти. Чему мы могли бы научиться у такого робота-историка?
Вот вам простой пример, знакомый каждому американцу. В наши дни принято говорить, что южные штаты полны (
После основания Соединенных Штатов Америки основополагающий документ – Статьи Конфедерации – наделил центральное правительство слабыми полномочиями и описывал новое государство не как национальное объединение, а, скорее, как «дружеский союз» между отдельными государствами, чем-то напоминающий современный Европейский союз. Люди воспринимали себя не гражданами США, а гражданами определенного штата (государства).
И в этом смысле граждане говорили о Соединенных Штатах во множественном числе, что было вполне закономерно для союза различных и в целом независимых государств. Например, в обращении президента Джона Адамса 1799 года говорится о «Соединенных Штатах
Когда же слова «Мы, народ…» (Конституция США, принятая в 1787 году) стали обозначать «одну нацию» (Клятва верности флагу, включенная в «Кодекс о флаге США» в 1942 году)? [1]
Если бы мы спросили об этом людей-историков, то, возможно, они бы указали нам на самый знаменитый ответ из финала знаменитой книги Джеймса Макферсона по истории гражданской войны – «Боевой клич свободы» [2]:
…Некоторые масштабные последствия войны кажутся очевидными. Были побеждены раскол и рабство, чтобы никогда не возникнуть вновь, даже через полтора столетия после Аппоматокса. Этот итог означал серьезную трансформацию американского общества и изменение государственного устройства, уточнившегося, если не сформировавшегося, в результате войны.
До 1861 года слова «Соединенные Штаты» чаще всего использовались как существительное во множественном числе: the United States are republic («Соединенные Штаты представляют собой республику»). Война привела к тому, что «Соединенные Штаты» стали в английском языке существительным в единственном числе.
Бьерн Страуструп , Бьёрн Страуструп , Валерий Федорович Альмухаметов , Ирина Сергеевна Козлова
Программирование, программы, базы данных / Базы данных / Программирование / Учебная и научная литература / Образование и наука / Книги по IT