Читаем Код бестселлера полностью

<p>Новогодние елки</p>

Когда дело касается компьютерного анализа и сравнения стиля тысяч романов, работа не ограничивается изучением слов в первом предложении. Процесс гораздо сложнее. Наш анализ стиля начинается со сбора нескольких тысяч параметров. Они обычно касаются употребления заурядных слов – таких как of, the, a, and[137], but[138] и т. п. Но кроме этого мы собираем информацию о синтаксисе, длине предложений, пунктуации, частях речи, а также – о наиболее часто встречающихся в книге глаголах, существительных, прилагательных и наречиях. Мы знаем, например, как часто Джон Гришэм использует прилагательные, а также кто больше любит запятые – Даниэла Стил или Донна Тартт. Мы вычисляем относительную частоту употребления определенных слов для каждой книги. Например, мы знаем, что в «Коде да Винчи» Дэн Браун употребляет артикль the семь раз на каждую сотню слов. А Джон Гришэм в «Фирме» – чуть менее шести раз на сотню. Если бы нам дали неподписанную книгу, принадлежащую перу одного из этих двоих, мы могли бы вполне обоснованно предположить, кто ее автор, – на основании того, как часто в ней используется the. В «Дороге» Кормака Маккарти слово and – второе по частоте (после the), а he – третье по частоте, оно встречается чуть меньше четырех раз на сотню слов. А вот местоимение she в «Дороге» почти не используется – всего одно на две тысячи слов. Напротив, в «Зове кукушки» she – седьмое по частоте слово, примерно 1,5 раза на сотню. В романе Энтони Дорра о Второй мировой войне два главных героя – мальчик и девочка, и местоимения his и her[139] имеют абсолютно одинаковую частоту (примерно одно на сотню слов). А вот в романе Норы Робертс «Последняя любовь» her встречается вдвое чаще, чем his. При этом Робертс нечасто использует местоимение второго лица you[140]. Зато Николас Спаркс в «Дневнике памяти» и Адам Джонсон в «Сыне повелителя сирот»[141] демонстрируют свою любовь к этому слову (1,3 упоминания на сотню у Спаркса и 1,4 – у Джонсона). Такие детали могут показаться чересчур мелкими, но они подобны деталям отпечатков пальцев – те тоже мелкие, но от них могут зависеть вопросы жизни и смерти.

Наша модель берет самые элементарные составляющие стиля – даже не камни фундамента, а раствор, скрепляющий эти камни, – и показывает нам, как каждая из них фигурирует (или не фигурирует) в том или ином романе. Эти сырые данные об индивидуальных элементах дают нам базовую информацию о стиле автора – сколько он использует запятых, двоеточий, апострофов и прочих знаков препинания, а также самых простых и распространенных глаголов (таких как did[142] и want[143]), существительных (таких как man[144] и woman[145]), прилагательных и наречий. На этом уровне мы еще не задаемся вопросом, какие предложения более типичны для автора: Peter designated the common garden tool that digs, an instrument of weeding the unwanted[146] – или Peter called a spade a damn useful shovel[147]. Но с помощью стилеметрического анализа мы мгновенно устанавливаем, что в первом предложении слово the встречается два раза, that, of и an – по одному, а во втором два раза встречается артикль a, но нет ни одного из слов the, that, an, of. Все эти артикли, местоимения и предлоги позволяют в два счета понять, какого стиля придерживается автор. Более длинные предложения требуют связующих конструкций – чего-то вроде строительных лесов или подпорок. Узнав, с какой частотой автор употребляет эти и другие служебные слова, мы получаем его стилистическую «подпись». Совокупность всех частот – это стилистические «позывные» автора, они всегда одни и те же, независимо от того, какое имя стоит на рукописи – Роулинг или Гэлбрейт.

Мы ввели в бестселлерометр тексты нескольких тысяч книг и научили его замечать эти базовые элементы стиля. И наша система обнаружила, что для книг, попавших в список бестселлеров, характерны определенные стилистические предпочтения, повторяющиеся закономерности. По частоте всего 491 самых распространенных слов и знаков препинания машина смогла отличить бестселлеры от небестселлеров в 70 % случаев, а на основе всего лишь 148 параметров – в 68 %. Причем использовались помимо знаков препинания только самые распространенные служебные слова – никаких существительных, прилагательных, глаголов, данных о синтаксисе и строении предложений[148].

Перейти на страницу:

Похожие книги

100 абсолютных законов успеха в бизнесе
100 абсолютных законов успеха в бизнесе

Почему одни люди преуспевают в бизнесе больше других? Почему одни предприятия процветают, в то время как другие терпят крах? Известный лектор и писатель по вопросам бизнеса нашел ответы на эти очень трудные вопросы. В своей книге он представляет набор принципов, или `универсальных законов`, которые лежат в основе успеха деловых людей всего мира. Практические рекомендации Трейси имеют вид 100 доступных для понимания и простых в применении законов, относящихся к важнейшим сферам труда и бизнеса. Он также приводит примеры из реальной жизни, которые наглядно иллюстрируют, как работает каждый из законов, а также предлагает читателю упражнения по применению этих законов в работе и жизни.

Брайан Трейси

Деловая литература / Маркетинг, PR, реклама / О бизнесе популярно / Финансы и бизнес