Читаем Младший брат полностью

– Именно этим мы постоянно занимаемся на работе. С помощью компьютеров выявляем всевозможные ошибки, искажения и отклонения. Сначала даем компьютеру задание составить профиль среднестатистической записи из базы данных, потом ищем в этой базе записи, которые дальше всего отстоят от среднего значения. Так работает байесовская система анализа, и она существует уже много столетий. Не будь этого метода, мы бы не смогли отфильтровывать спам…

– Ты хочешь сказать, что полиция, как спам-фильтр, должна просеивать всех без разбора? – спросил я.

До сих пор папа никогда не сердился, если я начинал с ним спорить, но сегодня в нем словно натянулась какая-то пружина. Я все равно не мог удержаться. Ну как же, мой родной папа встает на сторону полиции!

– Я хочу сказать, что полиция действует совершенно разумно: начинает расследование с анализа данных, а уже после этого приступает к полевой работе, направляя людей выяснить, почему возникло то или иное отклонение. Вряд ли компьютер назовет полиции имя человека, которого следует арестовать, он просто помогает им найти иголку в стоге сена.

– Но ведь они сами создают этот стог сена! – возразил я. – Сгребают в кучу гигантские массивы данных из транспортной системы. И во всей этой горе мусора нет почти ничего, что стоило бы внимания полиции. Бесполезная трата сил и ресурсов.

– Понимаю, Маркус, что эта система тебе не нравится, потому что причиняет неудобства. Но ты-то как раз лучше всех должен понимать всю тяжесть ситуации. Тебе ведь не сделали ничего плохого? Наоборот, подвезли домой.

«Ага, ничего плохого, всего лишь грозили швырнуть в тюрьму», – подумал я, но вслух ничего не сказал. Понимал, что бессмысленно.

– Кроме того, ты так и не рассказал, где тебя черти носили и как ты умудрился накрутить такие необычные перемещения.

Тут уж я взвился.

– Помнится, ты говорил, что доверяешь мне и не хочешь шпионить. – Он часто повторял это. – Ты и правда хочешь, чтобы я отчитывался за каждую поездку?

* * *

Поднявшись к себе, я сразу снял с полки иксбокс. Не так давно я привинтил проектор к потолку, чтобы он направлял картинку на стену над моей кроватью. Для этого пришлось даже убрать мой роскошный настенный коллаж, собранный из афиш панк-концертов, которые я поснимал с уличных столбов и наклеил на большие листы белой бумаги.

Я включил иксбокс и стал смотреть, как на экране проявляется изображение. Хотел было написать Ванессе и Джолу, рассказать о своей стычке с полицией, но, едва коснувшись пальцами клавиатуры, вдруг остановился.

Меня охватило странное чувство – примерно такое же, как в тот день, когда я понял, что мой бедный «винегрет» завербовали шпионить против меня. На этот раз мне почудилось, что мой обожаемый икснет может докладывать в ДВБ о местонахождении каждого пользователя.

Вспомнились папины слова: «Сначала даем компьютеру задание составить профиль среднестатистической записи из базы данных, потом ищем в этой базе записи, которые дальше всего отстоят от среднего значения».

Икснет прекрасно защищен, потому что его пользователи не соединены с интернетом напрямую. Они перескакивают с одного иксбокса на другой, пока не найдут тот, что соединен с интернетом, потом вбрасывают в него свои данные в нечитабельном, зашифрованном виде. И нельзя понять, какие из гуляющих по сети пакетов относятся к икснету, а какие представляют собой старую банковскую или коммерческую отчетность и прочие криптованные материалы. Нет никаких намеков, соотносящих интернетовский трафик с икснетом и уж тем более – с его пользователями.

Но как же папина байесовская статистика? Когда-то я уже вникал в эту тему. Однажды мы с Дэррилом решили написать хороший спам-фильтр, а для этого используется байесовская методика. Томас Байес, британский математик, жил в восемнадцатом веке, и вспомнили о нем лишь через пару столетий после смерти, когда ученые-программисты поняли, что его система статистического анализа огромных массивов данных отлично применима в современных информационных Гималаях.

Байесовский метод работает примерно так. Предположим, у вас есть большая груда спама. Вы переписываете все слова, которые используются в спам-письмах, и подсчитываете, сколько раз встречается каждое из них. Полученный график называется гистограммой частотности слов, и из него можно понять, какова вероятность того, что некий набор слов представляет собой спам. Теперь возьмите партию электронных писем, которые не являются спамом (на профессиональном языке они называются «хэм», то есть «ветчина», в отличие от «спама», мясных консервов, реклама которых и породила название навязчивой информации, засоряющей почтовые ящики), и проделайте то же самое.

Перейти на страницу:

Все книги серии Младший брат

Похожие книги