Читаем Неизведанная территория полностью

Самый простой способ решить эту проблему состоит в том, чтобы перестать отслеживать упоминания полного имени человека и начать вместо этого отслеживать лишь фамилии. Дополнительное преимущество этого метода состоит в том, что вы (по уже указанным выше причинам) можете выловить значительно больше упоминаний. Основной же недостаток состоит в том, что некоторые невероятно знаменитые люди, такие как Франклин Делано Рузвельт и Тедди Рузвельт, имеют одну и ту же фамилию. Оба они влияют на частоту появления фамилии «Рузвельт» в наших данных, что не позволяет нам однозначно оценить вклад каждого из них.

Следует отметить и еще одну важную вещь – наш подход не делает различий между доброй и дурной славой. Данные n-грамов не дают нам должного контекста, должного количества слов, появляющихся до или после имени, чтобы понять, упоминалось ли оно в положительном или отрицательном смысле.

Но, увы, насколько бы интересными ни казались нам эти вопросы, придется пока что их отложить на потом. На данном этапе игры списки вроде нашего могут считаться промежуточным решением – наподобие аэродинамической трубы в стиле Райтов и уж точно не турбиной LenSx.

Итак, вот список десяти наиболее знаменитых людей, родившихся в последние два столетия:


1. Адольф Гитлер

2. Карл Маркс

3. Зигмунд Фрейд

4. Рональд Рейган

5. Иосиф Сталин

6. Владимир Ленин

7. Дуайт Эйзенхауэр

8. Чарльз Диккенс

9. Бенито Муссолини

10. Рихард Вагнер


Невозможно не поразиться тому факту, что список возглавляет Адольф Гитлер, один из величайших злодеев в истории человечества. По сути, в списке присутствует не менее трех массовых убийц – Гитлер, нацистский режим которого уничтожил от 10 до 11 миллионов невинных гражданских лиц и военнопленных; Иосиф Сталин, лидер Советского Союза, режим которого убил около 20 миллионов граждан собственной страны[132], и Бенито Муссолини, итальянский диктатор, присоединивший свою страну к «оси» Гитлера и спланировавший эфиопский геноцид, который привел к 300 тысячам смертей.

Убийства и слава связаны между собой. Трагический факт в истории современных Соединенных Штатов состоит в том, что время от времени ненормальные с оружием начинают заниматься массовыми убийствами. Один из множества парадоксов этого ужасного явления состоит в том, что убийца, бывший совершенно неизвестным прежде, оказывается в центре сильнейшего медийного шторма. С одной стороны, подобное новостное покрытие важно, поскольку люди должны знать, что произошло. Но с другой стороны, возникающее в результате внимание может стать мотивацией для других убийц. Марк Дэвид Чепмен, убивший Джона Леннона, именно об этом говорил комиссии, рассматривавшей вопрос о его досрочном освобождении: «Я сделал это ради внимания. В каком-то смысле я хотел украсть славу Джона Леннона и забрать ее себе» [133].

Как ни трагично, но этот же эффект проявляется даже при изучении исторических событий в максимальном масштабе. Мы использовали n-грамы для движения в прошлое и создали список десяти самых знаменитых людей для каждого из последних двадцати десятилетий. По состоянию примерно на 1940 год в нем не видно ни Гитлера, ни Сталина. Однако к 1950 году, после совершенных ими деяний небывалого масштаба и жестокости, Гитлер, Сталин и Муссолини оказались на первом, втором и пятом местах соответственно. Напротив, Авраам Линкольн, возможно, самый великий и самый высокоморальный из американских президентов, никогда не поднимался выше пятой позиции.

Итак, мы увидели, что изучение славы с помощью n-грамов может быть интригующим, вызывающим массу вопросов и даже веселым. Но у n-грамов есть и темная сторона. И самый страшный секрет, таящийся в них, звучит так: ничто не создает славу более эффективно, чем акты крайнего зла. Мы живем в мире, где самый верный путь к славе связан с убийством людей, и нам есть над чем задуматься.

Должно ли это быть именно так? Подсказку нам вновь могут дать n-грамы. Дело в том, что человек, оказавшийся раньше Гитлера на вершине списка славы и удерживавший первое место в период с 1880 по 1940 год, не был массовым убийцей. Это был писатель, социальный критик, «гениальный и любящий юморист» и хороший человек. Не исключено, что именно благодаря ему стало популярным рождественское поздравление «Веселого Рождества!».

Это был Чарльз Диккенс. Мир и война. Это было самое прекрасное время, это было самое злосчастное время.

Гигантский скачок для человечества

Спутник, запущенный СССР в 1957 году, захватил воображение всего мира и провозгласил начало космической гонки. Эту гонку Соединенные Штаты Америки выиграли 21 июля 1969 года, когда два американца приземлились на поверхности Луны и отправились на прогулку.

Точнее, космическую гонку выиграл Нил Армстронг, пролетевший 239 000 миль, чтобы стать первым человеком, прошедшим по поверхности внеземного мира. Возможно, вы о нем слышали.

Перейти на страницу:

Все книги серии Наука XXI век

Неизведанная территория
Неизведанная территория

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Жан-Батист Мишель , Эрец Эйден

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература

Похожие книги

Искусство статистики. Как находить ответы в данных
Искусство статистики. Как находить ответы в данных

Статистика играла ключевую роль в научном познании мира на протяжении веков, а в эпоху больших данных базовое понимание этой дисциплины и статистическая грамотность становятся критически важными. Дэвид Шпигельхалтер приглашает вас в не обремененное техническими деталями увлекательное знакомство с теорией и практикой статистики.Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики.На русском языке публикуется впервые.

Дэвид Шпигельхалтер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
От болезни тела – к исцелению души. Почему мы болеем?
От болезни тела – к исцелению души. Почему мы болеем?

Все болезни имеют глубокий смысл. Они передают ценнейшие послания психики. Психолог Торвальд Детлефсен и врач Рудигер Дальке помогают нам понять, о чем свидетельствуют инфекционные заболевания, головные боли, несчастные случаи, сердечные приступы и желудочные колики, а также рак и СПИД. Если вы осознаете картину собственной болезни, то сможете найти новый прямой путь к самому себе. Болезнь не является неприятной помехой на этом пути, ибо она сама – путь. Чем сознательнее мы к ней относимся, тем лучше она выполняет свои задачи. Наша цель – не борьба с болезнью, а ее использование для исцеления души.

Рудигер Дальке , Торвальд Детлефсен

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Эзотерика / Здоровье и красота / Дом и досуг