Читаем Страницы Миллбурнского клуба, 1 полностью

Краеугольный камень наших построений – великая идея Колмогорова о связи сложности и случайности. Накануне тяжелой фатальной болезни он, параллельно с далекими от математики Соломоновым и Чейтиным, дополнил ее вместе с Л.Левиным наброском «Абстрактной Теории» (ЧейКоЛеСо) Колмогоровской сложности (КС). ЧейКоЛеСо вдохновила Д.Хмелева [9] предложить ядро ССС-метода вне статистической модели. Для стационарной эргодической последовательности xN и фиксированного универсального сжатия (УС), длина сжатой последовательности xN – это аппроксимация условной КС. Однако длина сжатого участка генома (четырехбуквенной последовательности) превосходит длину участка в несколько раз и приближением условной КС не является. Кроме статистических моделей, нам не известны нетривиальные содержательные области, где для невычислимой КС можно построить сближающиеся вычислимые мажоранту и миноранту хотя бы теоретически. Поэтому замена КС на величину, полученную с помощью УС в работе [10], требует обоснования. Для последовательностей, приближаемых статистической моделью, вместо аналогий с КС нужно применять статистическую теорию УС, далекую от очевидности. Историю родственных работе [8] подходов (до [4], где появилась наша работающая версия ССС), можно найти в работе [10]. Все авторы следуют Хмелеву, некоторые добавляют преобразования из соображений, не имеющих отношения к статистике и только ухудшающих различающую способность метода, как в [10]. Замена ими КС на величину, полученную с помощью УС, не обоснованна. Поэтому их приложения сомнительны. Их классификатор плохо различает одноязычные литературные тексты [5] и зависит от энтропий текстов, что не было упомянуто в работе [10]. Их парадоксальное утверждение, что Л.Толстой – отдельная ветвь на дереве русских писателей, скорее всего, вызвано плохой подготовкой текстов: они не убрали для анализа значительные вкрапления французского с другой энтропией.

Разница в стиле частей повести «Путь-дороженька»

Метод использован нами для анализа первой повести, опубликованной М.Шолоховым, «Путь-дороженька». Она была напечатана в 1925 году в московской газете «Молодой ленинец» (## 93-97, 99, 101-104, 106, 107, 109-114). Шолохову в это время было двадцать лет (если считать верным его официальный год рождения – 1905). За его плечами были четыре года начальной сельской школы во время войны и краткие счетоводческие курсы в Ростове в 1920 году, где, надо полагать, завязалась его многолетняя дружба с видным чекистом Мирумовым. Потом – короткое пребывание в тюрьме по обвинению в коррупции во время его службы по сбору продналога. Он покинул Дон и приехал в Москву в конце 1922 года. Работал под крылом Мирумова, даже жил иногда в его квартире. Согласно Бар-Селле, Мирумов мог передать Шолохову рукописи диссидентского редактора местной газеты Вениамина Краснушкина, автора многочисленных статей и двух повестей, писавшего под псевдонимом Виктор Севский и принадлежавшего к кругу известного поэта Бальмонта. Виктор Севский был арестован и ликвидирован большевиками в Ростовской тюрьме (как считается, в 1920 году).

Шолохов публикует первый рассказ в конце 1924 года. Он покидает Москву и едет в свою родную деревню. Там он остается в течение нескольких лет с перерывами на сравнительно короткие визиты в Москву, где он время от времени живет в квартире Мирумова и посвящает ему свои первые произведения.

Какие-либо изменения в писательском стиле Шолохова между первой и второй частями повести «Путь-дороженька», опубликованной в 1925 году, представляются маловероятными.

После предварительной обработки текста повести «Путь-дороженька» (включающей, в частности, удаление имен собственных) мы разбили каждую часть повести на 30 равных частей по 2000 байт каждая. Средние безусловные сложности  были статистически одинаковы. Средняя интра-CCC в каждой части была сравнена со средней интер-CCC каждого куска, обучаемого на другой части. Их среднеквадратичные отклонения статистически не различались. Разность между средней интер-CCC и средней интра-CCC оказалась значимой, превышая в четыре раза ее среднеквадратичное отклонение.

 

             График 1. Интер-ССС                      График 2. Интра-ССС

Детали вычислений таковы: мы посчитали 30 интер-CCC (кусок части 2 плюс часть 1 целиком) и 30 интра-CCC (кусок части 1 плюс остающийся текст части 1). Средняя интер-CCC: , и средняя интра-CCC: . Их разность равна 17.34, среднеквадратичное отклонение интер-CCC равно , среднеквадратичное отклонение интра-CCC равно . Среднеквадратичное отклонение разности  равно                                       . F-отношение < 2 допускает использование t-критерия со значением статистики, равным                                          .

Это t-значение при числе степеней свободы 58 делает соответствующее значение P (то есть вероятность такого же или большего CCC-отклонения), равным примерно .

Перейти на страницу:

Похожие книги

Заберу тебя себе
Заберу тебя себе

— Раздевайся. Хочу посмотреть, как ты это делаешь для меня, — произносит полушепотом. Таким чарующим, что отказать мужчине просто невозможно.И я не отказываю, хотя, честно говоря, надеялась, что мой избранник всё сделает сам. Но увы. Он будто поставил себе цель — максимально усложнить мне и без того непростую ночь.Мы с ним из разных миров. Видим друг друга в первый и последний раз в жизни. Я для него просто девушка на ночь. Он для меня — единственное спасение от мерзких планов моего отца на моё будущее.Так я думала, когда покидала ночной клуб с незнакомцем. Однако я и представить не могла, что после всего одной ночи он украдёт моё сердце и заберёт меня себе.Вторая книга — «Подчиню тебя себе» — в работе.

Дарья Белова , Инна Разина , Мэри Влад , Олли Серж , Тори Майрон

Современные любовные романы / Эротическая литература / Проза / Современная проза / Романы