Читаем Младший брат полностью

Я ждал, пока загрузится программа, наблюдая за процессом на освещенной стене. Мне хотелось послать электронные сообщения Ванессе и Джолу, поделиться с ними своими мыслями по поводу сегодняшней истории с копами. Я уже положил пальцы на клавиши, но остановился.

У меня на душе вдруг стало очень паршиво. Почти такое же отвратное чувство я испытал в ту минуту, когда понял, что моего старого, многострадального «винегрета» завербовали в стукачи. А сейчас мне пришло в голову, что любимый мной икснет может запросто барабанить дээнбистам о местонахождении каждого из своих пользователей.

Вспомнились отцовские слова: «Сначала мы даем программе задание определить параметры среднестатистической позиции в базе данных, а затем отыскать те позиции, чьи параметры больше всего отличаются от среднестатистических».

Надежность икснета заключается в том, что его пользователи не связаны напрямую с Интернетом. Они как бы перескакивают с иксбокса на иксбокс, пока не отыщется тот, что подключен к Интернету. Тут и происходит передача информации в нечитабельном, зашифрованном виде, так что непонятно, какие из гуляющих по Интернету сообщений икснетовские, а какие всего лишь обычные банковские переводы, коммерческая корреспонденция и прочая криптованная переписка. Нет никаких концов, привязывающих интернетовский трафик к икснету и, тем более, к пользователям икснета.

Да, но как насчет упомянутой отцом «байесовой статистики»? Я довольно хорошо знаком с этим математическим приемом. Мы с Даррелом как-то взялись написать собственную фильтрующую программу против спама, а в таком деле без байесовой математики не обойтись. Британский математик Томас Байес жил в XVIII веке в полной неизвестности, и только спустя два столетия после его смерти ученые-программисты по достоинству оценили предложенный им метод статистического анализа большого объема данных. Именно с его помощью они сумели свернуть современные информационные Гималаи.

Байесова статистика работает примерно так. Скажем, ваш почтовый ящик завалило спамом. Сначала вам надо подсчитать количество повторений каждого отдельного слова во всех рекламных объявлениях. В итоге вы получите «гистограмму частотности употребления слов», которая указывает степень вероятности, что тот или иной объем словесной информации окажется спамом. Теперь проделайте то же самое с тонной е-мейла, который заведомо не спам (на профессиональном сленге его именуют «хэм», «ветчина», в отличие от «спам», названия мясных консервов, чья реклама и породила обобщающее название для всякой ненужной информации в Интернете, засоряющей электронные почтовые ящики).

Затем подсчитайте количество слов в только что поступившем по е-мейлу сообщении и по частотной гистограмме определите, к какой «куче» — спама или хэма — оно принадлежит вероятнее всего. Если окажется, что это спам, подкорректируйте гистограмму в соответствии с новыми данными. Существует множество способов усовершенствовать этот метод — например, подсчитывать слова парами, периодически вычищать устаревшие данные, — но принцип работы остается тот же. В общем, как все гениальное, идея простая и очевидная, когда ее преподнесут тебе на тарелочке.

Для нее найдется уйма применений. Вы можете поставить перед компьютером задачу сосчитать линии на картинке и проверить, чему больше соответствует результат: гистограмме частотности линий «собака» или гистограмме частотности линий «кошка». Программа сумеет выявить порнуху, банковские махинации, словесные флейм-войны на веб-форумах и чатах. Полезная штука.

Но для икснета она не предвещала ничего хорошего. Представьте, что ДНБ держит на подслушке весь Интернет (а так оно, наверное, и есть). Они, конечно, не могут определить отправителей икснетовских сообщений по их зашифрованному содержанию.

Зато дээнбисты могут запросто вычислить, кто шлет в несколько раз больше шифрованного материала, чем основная масса пользователей Интернета. Для обычного сеанса онлайновой связи соотношение открытого и шифрованного текста составляет примерно 95 процентов к пяти. Если же в чьей-то исходящей почте это соотношение имеет обратную пропорцию, то ДНБ, наверное, захочет отрядить парочку своих шестерок вроде Сопливого и Прыщавого, только башковитых по компьютерной теме, чтобы поспрошать тех отправителей, не занимаются ли они терроризмом или сбытом наркотиков.

Перейти на страницу:

Все книги серии Младший брат

Похожие книги