Читаем Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры полностью

Макферсон был не первым, кто выдвинул такое предположение; эта тема обсуждается уже не менее сотни лет. Стоит хотя бы вспомнить выдержку из статьи в газете Washington Post, опубликованной в 1887 году[3]:

Какое-то время, буквально несколько лет назад, о Соединенных Штатах говорилось во множественном числе. Было принято говорить: «Соединенные Штаты имеют» или «Соединенные Штаты являлись». Однако война все изменила. Вопрос грамматики был навсегда решен на линии огня от Чесапика до Сэбин-Пасс. Решение приняли не Уэллс, не Грин, не Линдли Мюррей, а сабли Шеридана, мушкеты Шермана и артиллерия Гранта… Поражение мистера Дэвиса и генерала Ли означало переход от множественного числа к единственному.

Даже через сто лет после того, как была написана эта потрясающая история о языке, артиллерии и приключениях, сложно сдержать волнение. Кто бы мог представить, что люди станут сражаться за грамматику или что «мушкеты Шермана» решат спор о тонкостях словоупотребления?

Но стоит ли этому верить?

Возможно. Джеймс Макферсон – бывший президент Американской исторической ассоциации и настоящая легенда среди историков. Его самая знаменитая работа «Боевой клич свободы» получила Пулитцеровскую премию. Более того, кто бы ни написал в 1887 году статью в Washington Post, Макферсон, вероятнее всего, сам испытал этот синтаксический переворот, и его свидетельству сложно не верить.

Тем не менее Джеймс Макферсон, каким бы великим он ни был, не непогрешим. А свидетели иногда неправильно интерпретируют факты. Можно ли с этим что-то сделать?

Возможно. Давайте предположим, что мы попросили нашего робота – гипотетического робота, прочитавшего все книги из всех библиотек, – поделиться с нами своим механистическим мнением.

Представим, что в ответ на наш вопрос услужливый робот-историк обращается к своей бездонной памяти и рисует график[4]. На нем показано, насколько часто использовалось с течением времени понятие «Соединенные Штаты» в единственном или множественном числе в книгах на английском языке, опубликованных в США. Горизонтальная ось – течение времени, год за годом. На вертикальной оси указана частота употребления двух фраз в среднем на каждый миллиард слов текста за год. К примеру, робот прочитал 313 388 047 слов в книгах, опубликованных в 1831 году. Внутри этих слов робот видит фразу the United States is (то есть единственное число) 62 759 раз. Иными словами, в этом году данное выражение встречалось 20 раз на миллиард слов, что отражено в высоте синей линии за 1831 год.



Подобный график дает четкое представление о том, когда именно люди стали упоминать Соединенные Штаты в единственном числе.

Есть только одна небольшая проблема: судя по гипотетическому графику гипотетического робота, история, которую мы вам рассказываем, неверна. Во-первых, переход от множественного числа к единственному не был мгновенным. Он был постепенным, начался в 1810-х и продолжался вплоть до 1980-х – то есть более полутора столетий.

Но еще важнее то, что во времена Гражданской войны не происходило никакого резкого перехода. В сущности, период войны не особенно сильно отличался от времени до нее или после. Хотя в послевоенный период и началось некоторое ускорение процесса, однако оно произошло не ранее чем через пять лет после сдачи в плен генерала Ли. Согласно нашему роботу, единственное число не стало общеупотребительным вплоть до 1880 года (спустя пятнадцать лет после окончания войны) [5]. И даже сейчас время от времени можно увидеть колыхание знамен лингвистической «конфедерации».

Разумеется, все это выглядит довольно умозрительно, поскольку наша история о роботе с навыками скоростного чтения, превосходящего в своей способности к анализу и свидетеля событий, и историка-лауреата, кажется совершенно надуманной.

Однако все это действительно так.

Макферсон, несмотря на всю свою гениальность, ошибался в вопросе о единственном числе. Свидетель помнил события неточно. А робот, о котором мы вам рассказывали, существует на самом деле. График, приведенный чуть выше, был действительно нарисован роботом. И своей очереди еще ждут миллиарды других графиков. В наши дни миллионы людей по всему миру видят историю совершенно по-новому – цифровыми глазами робота.

Форма света

Стоит сказать, что не впервые на наше видение мира влияет появление той или иной новой линзы.

Перейти на страницу:

Похожие книги

97 этюдов для архитекторов программных систем
97 этюдов для архитекторов программных систем

Успешная карьера архитектора программного обеспечения требует хорошего владения как технической, так и деловой сторонами вопросов, связанных с проектированием архитектуры. В этой необычной книге ведущие архитекторы ПО со всего света обсуждают важные принципы разработки, выходящие далеко за пределы чисто технических вопросов.?Архитектор ПО выполняет роль посредника между командой разработчиков и бизнес-руководством компании, поэтому чтобы добиться успеха в этой профессии, необходимо не только овладеть различными технологиями, но и обеспечить работу над проектом в соответствии с бизнес-целями. В книге более 50 архитекторов рассказывают о том, что считают самым важным в своей работе, дают советы, как организовать общение с другими участниками проекта, как снизить сложность архитектуры, как оказывать поддержку разработчикам. Они щедро делятся множеством полезных идей и приемов, которые вынесли из своего многолетнего опыта. Авторы надеются, что книга станет источником вдохновения и руководством к действию для многих профессиональных программистов.

Билл де Ора , Майкл Хайгард , Нил Форд

Программирование, программы, базы данных / Базы данных / Программирование / Книги по IT
Программирование. Принципы и практика использования C++ Исправленное издание
Программирование. Принципы и практика использования C++ Исправленное издание

Специальное издание самой читаемой и содержащей наиболее достоверные сведения книги по C++. Книга написана Бьярне Страуструпом — автором языка программирования C++ — и является каноническим изложением возможностей этого языка. Помимо подробного описания собственно языка, на страницах книги вы найдете доказавшие свою эффективность подходы к решению разнообразных задач проектирования и программирования. Многочисленные примеры демонстрируют как хороший стиль программирования на С-совместимом ядре C++, так и современный -ориентированный подход к созданию программных продуктов. Третье издание бестселлера было существенно переработано автором. Результатом этой переработки стала большая доступность книги для новичков. В то же время, текст обогатился сведениями и методиками программирования, которые могут оказаться полезными даже для многоопытных специалистов по C++. Не обойдены вниманием и нововведения языка: стандартная библиотека шаблонов (STL), пространства имен (namespaces), механизм идентификации типов во время выполнения (RTTI), явные приведения типов (cast-операторы) и другие. Настоящее специальное издание отличается от третьего добавлением двух новых приложений (посвященных локализации и безопасной обработке исключений средствами стандартной библиотеки), довольно многочисленными уточнениями в остальном тексте, а также исправлением множества опечаток. Книга адресована программистам, использующим в своей повседневной работе C++. Она также будет полезна преподавателям, студентам и всем, кто хочет ознакомиться с описанием языка «из первых рук».

Бьерн Страуструп , Бьёрн Страуструп , Валерий Федорович Альмухаметов , Ирина Сергеевна Козлова

Программирование, программы, базы данных / Базы данных / Программирование / Учебная и научная литература / Образование и наука / Книги по IT