О методе Фарра практически забыли на десятилетия, пока в начале XX века Джон Браунли не вернул его в эпидемиологию. Браунли обратил внимание на то, что упустил Фарр: если вы моделируете эпидемию, чтобы отношение отношений было постоянным, как это делал Фарр с оспой, то у вас получается красивая симметричная кривая, которая падает так же быстро, как и поднимается. На самом деле это не что иное, как нормальное распределение, или колоколообразная кривая, играющая центральную роль в теории вероятностей. Люди, которые немного разбираются в математике, относятся к колоколообразной кривой со своего рода фетишистским почтением. Она описывает потрясающее разнообразие природных явлений. Однако распространение и спад эпидемий не входят в их число. Фарр это знал: еще в 1866 году он брал третье отношение вместо второго и предсказывал, что волна чумы будет асимметричной и спадет быстрее, чем поднималась. Браунли тоже признавал, что строгое совпадение с нормальной кривой – это редкость для реальных эпидемий. Тем не менее каким-то образом понятие «закон Фарра» стало означать, что эпидемии следуют примерно симметричной колоколообразной кривой, хотя сам Фарр был достаточно сведущ, чтобы с этим не соглашаться. Я склонен называть его «законом» Фарра, чтобы подчеркнуть, что на самом деле это не закон. Хотя, возможно, лучше было бы назвать его «законом» «Фарра».
Такое жесткое представление порождает опасность плохой экстраполяции. В 1990 году Деннис Брегман и Александр Ленгмюр (легендарный эпидемиолог, предпочитавший практические исследования «в поле», а не чисто лабораторные работы) опубликовали статью под названием «Закон Фарра в применении к прогнозам СПИДа». Ссылаясь на успешный прогноз Фарра в борьбе с чумой крупного рогатого скота, они провели аналогичный анализ статистики СПИДа в Соединенных Штатах. Однако приняли слишком узкую точку зрения, что кривая эпидемии должна быть симметричной и что распространенность СПИДа будет снижаться так же быстро, как увеличивалась. Ученые пришли к выводу, что СПИД уже прошел пик и что в 1995 году в США должно быть зафиксировано всего около 900 случаев заболевания.
На самом деле их было выявлено 69 тысяч.
Это возвращает нас в 2020 год к COVID-19. Многие прогнозы[431]
предпочитают рисовать смертность от коронавируса в каждом штате в виде идеально симметричной колоколообразной кривой. Вовсе не потому, что авторы – ее фетишисты; просто они обнаружили, что именно она лучше всего соответствует немногочисленным данным за первые недели вспышки. Для некоторых эпидемий это могло бы сработать. Однако кривая для COVID-19 оказалась стабильно асимметричной, стремительно взлетая в каждом регионе, а затем снижаясь с мучительной медлительностью, оставляя за собой болезни и страх. Эта эпидемия поднимается на лифте, а спускается по лестнице. Если ваш прогноз настаивает на ином, он будет противоречить истине: не надо проталкивать колоколообразную кривую и пытаться подкрутить настройки, когда новые данные будут входить в противоречие с предсказаниями.Мы здесь сталкиваемся с серьезной проблемой, общей для всех попыток математически спроецировать настоящее в будущее. Сделать прогноз – значит высказать предположение о законе, который управляет интересующей вас переменной. Иногда этот закон прост, как в случае движения теннисного мяча. Он обладает приятной симметрией: время от броска до верхней точки равно тому же количеству времени, которое нужно, чтобы мяч вернулся в вашу руку. Более того, если вы будете аккуратно измерять высоту мяча над землей каждую секунду и запишете последовательно все эти числа, то обнаружите, что разности разностей в этой последовательности будут всегда одинаковыми – на протяжении всей параболической дуги полета мяча. Именно это – характерное свойство параболы, отличающее ее от полуокружности или перевернутой цепной линии, форму которой имеет арка в Сент-Луисе «Ворота Запада»[432]
. Если вам повезет, вы сможете обнаружить подобные закономерности, даже не понимая лежащего в их основе механизма; Галилей открыл параболический закон движения тела путем тщательных наблюдений – за десятки лет до того, как Ньютон разработал общую теорию сил и ускорений.Однако иногда законы не просты! Если диапазон законов, где мы готовы искать, слишком узок – например, если мы настаиваем, что пандемия следует симметричным курсом, когда отношение отношений равно константе, – то мы потерпим неудачу в попытках привязать к реальности наше слишком жесткое правило. Получается недостаточная подгонка данных. То же самое происходит с алгоритмом машинного обучения, когда у него недостаточно ручек или они непригодны.