Читаем Цифры врут. Как не дать статистике обмануть себя полностью

Иногда предсказывают не события с двумя возможными исходами – пойдет или не пойдет дождь, – а что-нибудь меняющееся, например число случаев заболеваний малярией в Ботсване в следующем году, или (как в примерах, которые мы рассматривали раньше) размеры ВВП, или завтрашнюю температуру в Крауч-Энде. Тогда в ответе требуется не просто «да» или «нет», а какое-то число: экономика вырастет на 3 % или будет 900 случаев заражения малярией.

Конечно, результат не будет равен точно 3 % или 900 случаев. Вам нужен интервал неопределенности – точно как с p-значениями; это интервал вокруг вашего центрального предсказания, в который реальное значение будет попадать заданный процент времени (обычно 95 %). Так вы можете сказать, что завтра температура в Крауч-Энде составит 18 °C с 95 %-ным интервалом неопределенности от 13 до 23 °C. Чем увереннее автор прогноза, тем уже интервал неопределенности; если же уверенности у него маловато, интервал будет очень большим.

Погода – вещь непростая; это типичный пример сложной хаотичной системы. Но в итоге все сводится к физике. Улучшив алгоритмы и повысив мощность компьютеров, вы лучше разберетесь в системе.

Погода – не единственное, что мы пытаемся предсказывать. Мы стремимся предсказывать и поведение людей, например экономический рост, который определяется поведением миллионов жителей какой-то страны или всего мира. И это еще сложнее, отчасти потому, что люди реагируют на предсказания. Если спрогнозировать на завтра дождь, маловероятно, что это повлияет на осадки. Но если предсказать рост биржевого рынка, это может подтолкнуть кого-то к покупке акций.

Экономистам часто говорят (у одного из нас это уже в печенках сидит), что люди слишком сложные создания, чтобы можно было предугадать их поведение, поэтому моделировать его невозможно. Но это неправда, иначе всякие догадки об их поведении были бы ничем не лучше случайных утверждений, а это явно не соответствует действительности. Например, с большой вероятностью можно предположить, что, читая эту книгу, вы не стоите на голове – намного вероятнее, что вы сидите. Многие предположения о поведении людей можно делать с большой уверенностью. И прогнозирование экономики или выборов на основе опросов населения оказывается гораздо точнее, чем случайные догадки.

Прогнозирование опирается на модели. Прогноз – это предсказание: экономика вырастет на 2 % или за выходные выпадет 12 мм осадков. Модель – это основа прогнозов, имитация части мира.

Думая о моделях, мы представляем себе что-то замысловатое, вроде математики и уравнений. Зачастую модели действительно сложны, но бывают и простыми.

Представьте, что вы хотите выяснить, с какой вероятностью в ближайший час пойдет дождь. Сейчас мы построим модель – «взгляд из окна». Первое, что нужно сделать, посмотрев в окно, – это решить, какая информация поможет сделать прогноз.

Очевидный кандидат – облачность. Если небо сияет голубизной и не видно ни тучки, то осадки крайне маловероятны. Если оно полностью затянуто облаками, то дождь, скорее всего, пойдет. Если серединка на половинку – шансы равны.

Начало положено. Еще можно учесть цвет облаков: насколько они темные? Можно было бы добавить кучу других факторов: местоположение, время года, температуру воздуха, скорость ветра. Но мы ограничимся двумя характеристиками.

Писать каждый раз «облачность, умноженная на темноту облаков, равняется вероятности дождя» довольно утомительно, поэтому мы введем сокращения. Облачность обозначим буквой C, вероятность дождя – R, а чтобы придать нашим записям наукообразный вид, среднюю темноту облаков – греческой буквой бета – β (это ведь наша модель – как хотим, так и называем). Получилось уравнение: βC = R.

Это уравнение и есть наша модель.

Мы выглянули в окно и увидели, что небо затянуто облаками, но они совсем светлые, так что по шкале облачности у нас вышло 100 %, а по серой шкале – 10 %. Умножим 100 % на 10 % и получим 10 %, так что вероятность дождя по нашей формуле – 10 %. Это наш результат.

Возможно, он очень плох. Нужна обратная связь: делаем прогноз по нашей модели, смотрим, как часто он сбывается (идет ли дождь во всех предсказанных случаях?) и корректируем модель. Если оказалось, что цвет облаков играет более важную роль, его вес повышают. И наоборот. Модель готова. Можно создавать гораздо более сложные – модель британского метеоцентра содержит более миллиона строк кода, – но принцип один и тот же: вы вводите в модель данные и получаете результат.

Перейти на страницу:

Похожие книги

Управление мировоззрением. Подлинные и мнимые ценности русского народа
Управление мировоззрением. Подлинные и мнимые ценности русского народа

В своей новой книге автор, последовательно анализируя идеологию либерализма, приходит к выводу, что любые попытки построения в России современного, благополучного, процветающего общества на основе неолиберальных ценностей заведомо обречены на провал. Только категорический отказ от чуждой идеологии и возврат к основополагающим традиционным ценностям помогут русским людям вновь обрести потерянную ими в конце XX века веру в себя и выйти победителями из затянувшегося социально-экономического, идеологического, но, прежде всего, духовного кризиса.Книга предназначена для тех, кто не равнодушен к судьбе своего народа, кто хочет больше узнать об истории своего отечества и глубже понять те процессы, которые происходят в стране сегодня.

Виктор Белов

Обществознание, социология