Читаем Математика с дурацкими рисунками. Идеи, которые формируют нашу реальность полностью

Их поиски лишенных смысла слов увенчались успехом, когда они взялись за предлог upon («на основании»), который Мэдисон не употреблял почти никогда, а Гамильтон при каждом удобном случае:

Вооруженные этими данными, Фред и Дейв смогли свести каждого автора к чему-то вроде колоды карт, раздающей те или иные слова с предсказуемой вероятностью. Затем, отследив частотность определенных слов в письмах с неустановленным авторством, они смогли узнать, из какой «колоды» взят каждый текст.

Метод сработал. Их вывод: «Практически наверняка эти 12 писем написаны Мэдисоном».

Полвека спустя эта технология стала стандартной. Она помогла установить авторство древнегреческой прозы, сонетов елизаветинцев и речей Рональда Рейгана. Бен Блатт применил этот алгоритм около 30 000 раз, используя 250 общеупотребительных слов, чтобы определить, кто из двух авторов написал определенную книгу. Он получил 99,4 % верных ответов.

Мой разум знает, что здесь нет подвоха. Но мои чувства бунтуют. Как можно понять книгу, измельчив ее на биты?

В 2011 году команда авторов из Лаборатории литературоведения Стэнфорда совершила ловкий кульбит: они идентифицировали уже не авторов, а жанры[215]. Они использовали два метода: анализ частотности употребления слов и более изощренный анализ на уровне предложений (под названием «Докускоп»). К их удивлению, оба метода позволили точно определять жанры текстов.

Присмотримся к фрагменту абзаца со страницы, которую компьютер счел наиболее «готической» во всем корпусе, включающем 250 романов:

Он шел по шатким плитам через двор, пока не достиг арки; здесь он остановился, ибо ему снова стало страшно. Однако, набравшись храбрости, он пошел дальше, все еще пытаясь следовать за той фигурой, и внезапно оказался в разрушенном зале, вид которого был более диким и пустынным, чем все увиденное им до сих пор. Охваченный непреодолимым ужасом, он направился обратно, но услышал ослабший измученный голос. Сердце замерло при этом звуке, его бросило в дрожь, и он был совершенно не в силах сойти с места. Звук, похожий на предсмертный стон, повторился…

У меня ползут мурашки по спине, и на то есть две причины. Во-первых, вся эта жуткая готика: разрушенные арки и предсмертные стоны. Во-вторых, жутковато, что компьютер распознал готическую атмосферу, даже не обратив внимания на слова «арка», «разрушенный» или «предсмертный стон». Он выделил этот отрывок на основе употребления местоимений, вспомогательных слов и глагольных конструкций.

Я нервничаю. Что такого знает алгоритм, чего не знаю я?

К моему облегчению, авторы высказали предположительный ответ. Нет ни одного элемента, позволяющего определить автора или жанр, ни одной уникальной черты, из которой следуют все остальные. Скорее проза имеет много отличительных черт, от галактической структуры романа до молекулярной структуры слогов. Статистические тенденции и глубокий смысл могут сосуществовать, живя бок о бок в одной и той же последовательности слов.

Большую часть времени я читаю ради архитектуры текста. Сюжет, тема, персонаж. Это высокоуровневая структура: аспекты, которые видны любому прохожему, но непроницаемы для статистики.

Если я присмотрюсь, то увижу кирпичную кладку. Клаузулы, конструкции предложений, оформление абзаца. Это микроуровневая структура, тщательно исследовать которую меня учили школьные учителя английского. Компьютер может научиться делать то же самое.

Есть и скрытая от глаз наноструктура: известь. Местоимения, предлоги, неопределенные артикли. Это строительный раствор, который скрепляет все вместе; он не заметен невооруженным глазом, но идеально подходит для химического статистического анализа.

Я знаю, что это всего лишь метафора, но призрак в моей голове говорит на языке метафор. Я воодушевленно подсчитал частоту употребления наречий в первой главе этой книги («Думать как математик»). Получилось 11 наречий на 1000 слов — почти как у Вирджинии Вулф, что я воспринял как благое знамение. Затем, не в силах удержаться, я убрал несколько наречий, пока их частота не снизилась до 8 на 1000 слов. Это уровень Хемингуэя и Тони Моррисона.

Я жульничал, и это было здорово.

Могут ли новые статистические методы гармонично сочетаться со старыми, более насыщенными, более человечными способами понимания языка? Да, теоретически.

<p>V. На пороге</p>Сила одного шага
Перейти на страницу:

Все книги серии Библиотека фонда «Эволюция»

Происхождение жизни. От туманности до клетки
Происхождение жизни. От туманности до клетки

Поражаясь красоте и многообразию окружающего мира, люди на протяжении веков гадали: как он появился? Каким образом сформировались планеты, на одной из которых зародилась жизнь? Почему земная жизнь основана на углероде и использует четыре типа звеньев в ДНК? Где во Вселенной стоит искать другие формы жизни, и чем они могут отличаться от нас? В этой книге собраны самые свежие ответы науки на эти вопросы. И хотя на переднем крае науки не всегда есть простые пути, автор честно постарался сделать все возможное, чтобы книга была понятна читателям, далеким от биологии. Он логично и четко формулирует свои идеи и с увлечением рассказывает о том, каким образом из космической пыли и метеоритов через горячие источники у подножия вулканов возникла живая клетка, чтобы заселить и преобразить всю планету.

Михаил Александрович Никитин

Научная литература
Ни кошелька, ни жизни. Нетрадиционная медицина под следствием
Ни кошелька, ни жизни. Нетрадиционная медицина под следствием

"Ни кошелька, ни жизни" Саймона Сингха и Эдзарда Эрнста – правдивый, непредвзятый и увлекательный рассказ о нетрадиционной медицине. Основная часть книги посвящена четырем самым популярным ее направлениям – акупунктуре, гомеопатии, хиропрактике и траволечению, а в приложении кратко обсуждаются еще свыше тридцати. Авторы с самого начала разъясняют, что представляет собой научный подход и как с его помощью определяют истину, а затем, опираясь на результаты многочисленных научных исследований, страница за страницей приподнимают завесу тайны, скрывающую неутешительную правду о нетрадиционной медицине. Они разбираются, какие из ее методов действенны и безвредны, а какие бесполезны и опасны. Анализируя, почему во всем мире так широко распространены методы лечения, не доказавшие своей эффективности, они отвечают не только на вездесущий вопрос "Кто виноват?", но и на важнейший вопрос "Что делать?".

Саймон Сингх , Эрдзард Эрнст

Домоводство / Научпоп / Документальное
Введение в поведение. История наук о том, что движет животными и как их правильно понимать
Введение в поведение. История наук о том, что движет животными и как их правильно понимать

На протяжении всей своей истории человек учился понимать других живых существ. А коль скоро они не могут поведать о себе на доступном нам языке, остается один ориентир – их поведение. Книга научного журналиста Бориса Жукова – своего рода карта дорог, которыми человечество пыталось прийти к пониманию этого феномена. Следуя исторической канве, автор рассматривает различные теоретические подходы к изучению поведения, сложные взаимоотношения разных научных направлений между собой и со смежными дисциплинами (физиологией, психологией, теорией эволюции и т. д.), связь представлений о поведении с общенаучными и общемировоззренческими установками той или иной эпохи.Развитие науки представлено не как простое накопление знаний, но как «драма идей», сложный и часто парадоксальный процесс, где конечные выводы порой противоречат исходным постулатам, а замечательные открытия становятся почвой для новых заблуждений.

Борис Борисович Жуков

Зоология / Научная литература

Похожие книги

История леса
История леса

Лес часто воспринимают как символ природы, антипод цивилизации: где начинается лес, там заканчивается культура. Однако эта книга представляет читателю совсем иную картину. В любой стране мира, где растет лес, он играет в жизни людей огромную роль, однако отношение к нему может быть различным. В Германии связи между человеком и лесом традиционно очень сильны. Это отражается не только в облике лесов – ухоженных, послушных, пронизанных частой сетью дорожек и указателей. Не менее ярко явлена и обратная сторона – лесом пропитана вся немецкая культура. От знаменитой битвы в Тевтобургском лесу, через сказки и народные песни лес приходит в поэзию, музыку и театр, наполняя немецкий романтизм и вдохновляя экологические движения XX века. Поэтому, чтобы рассказать историю леса, немецкому автору нужно осмелиться объять необъятное и соединить несоединимое – экономику и поэзию, ботанику и политику, археологию и охрану природы.Именно таким путем и идет автор «Истории леса», палеоботаник, профессор Ганноверского университета Хансйорг Кюстер. Его книга рассказывает читателю историю не только леса, но и людей – их отношения к природе, их хозяйства и культуры.

Хансйорг Кюстер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Зачем нужна геология: краткая история прошлого и будущего нашей планеты
Зачем нужна геология: краткая история прошлого и будущего нашей планеты

Каков риск столкновения астероида с Землей? Почему температура океана миллионы лет назад имеет значение сегодня? В увлекательном и доступном изложении Дуг Макдугалл дает обзор удивительной истории Земли, основанный на информации, извлеченной из природных архивов. Мы обнаруживаем, что наука о земле фактически освещает многие из наиболее насущных проблем сегодняшнего дня — доступность энергии, доступ к пресной воде, сельское хозяйство. Но более того, Макдугалл ясно дает понять, что наука также дает важные ключи к будущему планеты.Дуг Макдугалл — писатель, ученый-геолог и педагог. Почетный профессор в Институте океанографии Калифорнийского университета, где в течение многих лет преподавал и проводил исследования в области геохимии. Заядлый путешественник, его исследования провели его по всему миру, от Сибири и канадской Арктики до южной Индии, Китая и дна Тихого океана.

Дуг МакДугалл

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература