Читаем Шекспировские чтения, 1977 полностью

Лингвисты по-разному решают эту проблему. Некоторые, как А. Эллегорд {Ellegard A. A statistical method for determining authorship. Gotheburg, 1962.}, считают, что в текстах примерно одинакового характера (какого именно, не оговаривается) различия между авторами в употреблении слов и выражений должны быть сильнее различий, существующих между отдельными текстами одного и того же автора; другие ищут способы устранить влияние контекста.

Упомянутые уже Мостеллер и Уоллес, блестяще решившие загадку статей "Федералиста", а также Милич и Мортон {Milic L. T. Op. cit. Morion A., Levin M. Some indicators of authorship in Greek prose. - In: The computer and literary style.} высказываются в пользу грамматических, или "функциональных", слов, как менее зависимых от содержания текста.

Как следует из работы А. Шайкевича {Шайкевич А. Я. Опыт статистического выделения функциональных стилей. - Вопросы языкознания, 1968, э 1.}, статистические показатели употребительности тех или иных лингвистических элементов намного больше варьируют в текстах разных стилей, чем в текстах, написанных разными авторами, но относящихся к одному и тому же стилю.

Опыт исследования на материале драматургических и поэтических текстов английских авторов конца XVI - начала XVII в. показал, что и "функциональные" слова не являются исключением из общего правила. Большинство из них сильнее зависит от жанра и стиля, чем от принадлежности тому или иному автору {Подробное изложение этой работы см.; Каджазнуни Л. Опыт выделения и разграничения функциональных и индивидуальных стилей. УЧРП. зап. МГПИИЯ им. М. Тореза, 1970, вып. 54, с. 108-129.}.

Объектом исследования служили пьесы, поэмы и сонеты Шекспира, Марло, Чапмена, Лили и Бена Джонсона, за единицу подсчета принималось слово (как совокупность словоформ), а также словообразовательные классы слов (например, слова на -ed, -ing, dis- и т. д.).

С целью выявить факторы, оказывающие наибольшее влияние на употребительность лексических единиц, - это было задачей начального этапа исследования - тексты группировались, по сходству в употреблении определенных, специально отобранных признаков - слов и классов слов. Для этого использовался; метод корреляционного анализа.

После подсчета частот признаков в текстах между каждой парой исследуемых текстов вычислялся коэффициент корреляции, позволяющий установить, насколько данные тексты близки или же, напротив, расходятся по употребительности признаков, на основе которых производились вычисления. При анализе полученных таблиц коэффициентов корреляций выяснилось, что тексты, сходные по употребительности отобранных признаков, образуют группы (clumps или clusters), из которых пять, наиболее четких и хорошо поддающихся интерпретации, можно определить как жанровые и стилистические. Группа 1 "высокий", поэтический стиль, группа 2 - стиль "низкий", разговорный, (в эти группы вошли тексты разных авторов и разных жанров); группа А - поэтическая (ее составили три поэмы), группа В - трагедий политико-гражданского характера и группа С - комедий. Ни на одной из корреляционных таблиц, полученных на основе самых различных слов и классов слов, тексты не разбились по признаку авторства.

Поскольку некоторые тексты не вошли ни в одну из выделенных групп и полученная классификация оказалась слишком грубой, была разработана методика определения индексов, количественных характеристик, указывающих на большую или меньшую степень принадлежности данного текста к той или иной группе текстов. Индексы вычислялись на основе соотношения признаков, типичных и нетипичных для каждой группы. Таким образом, каждый текст получил количественную характеристику в каждой из стилистических или жанровых групп.

Например, пьеса Шекспира "Виндзорские кумушки" имеет следующие индексы {K1 - индекс группы "высокого" стиля, К2 - "низкого", разговорного стиля, Кa - поэтического жанра, Кb - жанра трагедии, Kc - жанра комедии.}.

К1 К2 Кa Кb Кс

-174,7 +132,4 -21,3 -76,9 +136,5

В то время как его поэма "Венера и Адонис":

К1 К2 Кa Кb Кс

+148,4 -159,6 +97,9 -29,6 -73,0

Из анализа приведенных выше данных со всей очевидностью следует, что "Виндзорские кумушки" - комедия, написанная разговорным, живым языком, а "Венера и Адонис" - поэтическое произведение, написанное "высоким" поэтическим стилем, - результат, способный поразить исследователя разве что своей тривиальностью. Оба эти текста, "Венера и Адонис" и "Виндзорские кумушки", относятся к наиболее ясным и простым случаям, и тот факт, что результаты формального анализа в простых случаях вполне совпадают с общепринятым мнением, говорит в пользу предлагаемой методики и дает исследователю право считать, что другие, неожиданные, результаты в более сложных случаях заслуживают самого серьезного рассмотрения.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже