Читаем Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры полностью

Разумеется, сказать проще, чем сделать. Джо и Тина посвятили несколько месяцев кропотливой работе, читая учебники древнеанглийского языка (языка «Беовульфа», на котором говорили примерно в 800 г. н. э.) и средневекового английского (языка Чосера, на котором говорили начиная примерно с XII столетия). Они нашли 177 староанглийских неправильных глаголов, развитие каждого из которых они смогли проследить на протяжении тысячи и более лет. Получив такую картину, мы наконец увидели, как менялся язык.

В древнеанглийском языке все 177 глаголов изначально были неправильными. К началу Средневековья, через четыре столетия, выжило лишь 145 неправильных форм; остальные 32 были приведены в соответствие с новыми нормами. В современном английском языке неправильными остались лишь 98. Остальные 79 глаголов до сих пор присутствуют в языке, однако, подобно глаголу melt («таять»), они изменили форму. При этом был заметен довольно примечательный дисбаланс. Из 12 наиболее часто встречающихся глаголов в нашем списке ни один не стал правильным – им удалось на протяжении 12 столетий сопротивляться давлению со стороны правила – ed. Нарушение пропорций шло и с другой стороны. Из 12 наименее часто использовавшихся глаголов в списке 11 стали правильными, в том числе bide («пребывать») и wreak («причинять»). Единственным выжившим неправильным глаголом с низкой частотой оказался slink («красться») – глагол, который как раз четко описывает этот тихий процесс исчезновения[66].

Данные показали: на человеческую культуру влияло нечто похожее на естественный отбор, оставляя следы в мире глаголов. Частота употребления была серьезнейшим фактором выживания глаголов – именно она приводила к тому, что некоторые прежние формы глаголов умирали и мы начинали их оплакивать (mourn – mourned), а другие приспособились (fit – fit) выживать.

Выживание наиболее приспособленных

В биологии проще показать сам факт естественного отбора, чем измерить степень родства между определенными признаками и степенью эволюционной приспособленности (легко сказать, что на улице ветрено, но куда сложнее определить, насколько сильно дует ветер). Не имея возможности рассчитать степень приспосабливаемости, мы можем лишь предположить, какие изменения будут успешными с точки зрения эволюции, но мы совершенно не представляем себе, сколько времени потребуется, чтобы эти изменения произошли.

Однако случай неправильных глаголов не очень характерен для биологической эволюции. В биологии для определения степени приспосабливаемости отдельного организма принимаются во внимание тысячи или даже миллионы признаков. Что же касается неправильных глаголов, было ясно, что их выживаемость в значительной степени определяется единственным признаком – частотой употребления. И это значительно упростило работу. Это значило, что мы сможем с довольно большой долей точности рассчитать, насколько быстро исчезнут неправильные формы глаголов.

Однако перед тем как заняться этим вопросом более основательно, позвольте напомнить о самом известном в науке примере исчезновения. Мы имеем в виду теорию радиоактивного излучения.

Радиоактивные материалы используются в массе устройств – от энергетических реакторов до медицинских сканирующих систем и бомб. Эти материалы постоянно находятся в процессе исчезновения, поскольку с течением времени атомы радиоактивного вещества превращаются в стабильные нерадиоактивные атомы. Этот распад высвобождает энергию, часто в форме радиоволн.

Именно поэтому радиоактивные вещества и получили свое название.

Самое важное свойство радиоактивного элемента – это его период полураспада, то есть период времени, в среднем требующийся для распада половины атомов в образце элемента[67]. Предположим, что у вас имеется вещество, период полураспада которого составляет один год. Если сначала у вас есть миллиард атомов этого вещества, то через год останется лишь половина миллиарда – другая половина миллиарда распадется на что-то другое. После двух лет у вас останется лишь четверть миллиарда атомов (половина от половины). Через три года останется одна восьмая и так далее.

В процессе изучения трансформации неправильных глаголов в правильные мы обнаружили, что если мы примем во внимание частоту употребления, то процесс выравнивания будет неотличим с математической точки зрения от процесса распада радиоактивного атома. Более того, зная частоту употребления неправильного глагола, мы могли создать формулу для расчета периода его полураспада. Это было замечательно, поскольку в случае радиоактивных атомов период полураспада определяется экспериментальным путем; его обычно невозможно рассчитать. В этом смысле математика радиоактивности лучше подходит неправильным глаголам, а не радиоактивным атомам.

Формула была простой и прекрасной – период полураспада глагола представляет собой квадратный корень от частоты его употребления. Неправильный глагол, использующийся в сто раз реже, приобретет правильную форму в десять раз быстрее.

Перейти на страницу:

Похожие книги

97 этюдов для архитекторов программных систем
97 этюдов для архитекторов программных систем

Успешная карьера архитектора программного обеспечения требует хорошего владения как технической, так и деловой сторонами вопросов, связанных с проектированием архитектуры. В этой необычной книге ведущие архитекторы ПО со всего света обсуждают важные принципы разработки, выходящие далеко за пределы чисто технических вопросов.?Архитектор ПО выполняет роль посредника между командой разработчиков и бизнес-руководством компании, поэтому чтобы добиться успеха в этой профессии, необходимо не только овладеть различными технологиями, но и обеспечить работу над проектом в соответствии с бизнес-целями. В книге более 50 архитекторов рассказывают о том, что считают самым важным в своей работе, дают советы, как организовать общение с другими участниками проекта, как снизить сложность архитектуры, как оказывать поддержку разработчикам. Они щедро делятся множеством полезных идей и приемов, которые вынесли из своего многолетнего опыта. Авторы надеются, что книга станет источником вдохновения и руководством к действию для многих профессиональных программистов.

Билл де Ора , Майкл Хайгард , Нил Форд

Программирование, программы, базы данных / Базы данных / Программирование / Книги по IT
Программирование. Принципы и практика использования C++ Исправленное издание
Программирование. Принципы и практика использования C++ Исправленное издание

Специальное издание самой читаемой и содержащей наиболее достоверные сведения книги по C++. Книга написана Бьярне Страуструпом — автором языка программирования C++ — и является каноническим изложением возможностей этого языка. Помимо подробного описания собственно языка, на страницах книги вы найдете доказавшие свою эффективность подходы к решению разнообразных задач проектирования и программирования. Многочисленные примеры демонстрируют как хороший стиль программирования на С-совместимом ядре C++, так и современный -ориентированный подход к созданию программных продуктов. Третье издание бестселлера было существенно переработано автором. Результатом этой переработки стала большая доступность книги для новичков. В то же время, текст обогатился сведениями и методиками программирования, которые могут оказаться полезными даже для многоопытных специалистов по C++. Не обойдены вниманием и нововведения языка: стандартная библиотека шаблонов (STL), пространства имен (namespaces), механизм идентификации типов во время выполнения (RTTI), явные приведения типов (cast-операторы) и другие. Настоящее специальное издание отличается от третьего добавлением двух новых приложений (посвященных локализации и безопасной обработке исключений средствами стандартной библиотеки), довольно многочисленными уточнениями в остальном тексте, а также исправлением множества опечаток. Книга адресована программистам, использующим в своей повседневной работе C++. Она также будет полезна преподавателям, студентам и всем, кто хочет ознакомиться с описанием языка «из первых рук».

Бьерн Страуструп , Бьёрн Страуструп , Валерий Федорович Альмухаметов , Ирина Сергеевна Козлова

Программирование, программы, базы данных / Базы данных / Программирование / Учебная и научная литература / Образование и наука / Книги по IT