Читаем The Black Swan: The Impact of the Highly Improbable полностью

The problem of the circularity of statistics (which we can also call the statistical regress argument) is as follows. Say you need past data to discover whether a probability distribution is Gaussian, fractal, or something else. You will need to establish whether you have enough data to back up your claim. How do we know if we have enough data? From the probability distribution—a distribution does tell you whether you have enough data to “build confidence” about what you are inferring. If it is a Gaussian bell curve, then a few points will suffice (the law of large numbers once again). And how do you know if the distribution is Gaussian? Well, from the data. So we need the data to tell us what the probability distribution is, and a probability distribution to tell us how much data we need. This causes a severe regress argument.

This regress does not occur if you assume beforehand that the distribution is Gaussian. It happens that, for some reason, the Gaussian yields its properties rather easily. Extremistan distributions do not do so. So selecting the Gaussian while invoking some general law appears to be convenient. The Gaussian is used as a default distribution for that very reason. As I keep repeating, assuming its application beforehand may work with a small number of fields such as crime statistics, mortality rates, matters from Mediocristan. But not for historical data of unknown attributes and not for matters from Extremistan.

Now, why aren’t statisticians who work with historical data aware of this problem? First, they do not like to hear that their entire business has been canceled by the problem of induction. Second, they are not confronted with the results of their predictions in rigorous ways. As we saw with the Makridakis competition, they are grounded in the narrative fallacy, and they do not want to hear it.

ONCE AGAIN, BEWARE THE FORECASTERS

Let me take the problem one step higher up. As I mentioned earlier, plenty of fashionable models attempt to explain the genesis of Extremistan. In fact, they are grouped into two broad classes, but there are occasionally more approaches. The first class includes the simple rich-get-richer (or big-get-bigger) style model that is used to explain the lumping of people around cities, the market domination of Microsoft and VHS (instead of Apple and Betamax), the dynamics of academic reputations, etc. The second class concerns what are generally called “percolation models,” which address not the behavior of the individual, but rather the terrain in which he operates. When you pour water on a porous surface, the structure of that surface matters more than does the liquid. When a grain of sand hits a pile of other grains of sand, how the terrain is organized is what determines whether there will be an avalanche.

Most models, of course, attempt to be precisely predictive, not just descriptive; I find this infuriating. They are nice tools for illustrating the genesis of Extremistan, but I insist that the “generator” of reality does not appear to obey them closely enough to make them helpful in precise forecasting. At least to judge by anything you find in the current literature on the subject of Extremistan. Once again we face grave calibration problems, so it would be a great idea to avoid the common mistakes made while calibrating a nonlinear process. Recall that nonlinear processes have greater degrees of freedom than linear ones (as we saw in Chapter 11), with the implication that you run a great risk of using the wrong model. Yet once in a while you run into a book or articles advocating the application of models from statistical physics to reality. Beautiful books like Philip Ball’s illustrate and inform, but they should not lead to precise quantitative models. Do not take them at face value.

But let us see what we can take home from these models.

Once Again, a Happy Solution

First, in assuming a scalable, I accept that an arbitrarily large number is possible. In other words, inequalities should not stop above some known maximum bound.

Say that the book The Da Vinci Code sold around 60 million copies. (The Bible sold about a billion copies but let’s ignore it and limit our analysis to lay books written by individual authors.) Although we have never known a lay book to sell 200 million copies, we can consider that the possibility is not zero. It’s small, but it’s not zero. For every three Da Vinci Code-style bestsellers, there might be one superbestseller, and though one has not happened so far, we cannot rule it out. And for every fifteen Da Vinci Codes there will be one superbestseller selling, say, 500 million copies.

Перейти на страницу:

Похожие книги

Опасные советские вещи. Городские легенды и страхи в СССР
Опасные советские вещи. Городские легенды и страхи в СССР

Джинсы, зараженные вшами, личинки под кожей африканского гостя, портрет Мао Цзедуна, проступающий ночью на китайском ковре, свастики, скрытые в конструкции домов, жвачки с толченым стеклом — вот неполный список советских городских легенд об опасных вещах. Книга известных фольклористов и антропологов А. Архиповой (РАНХиГС, РГГУ, РЭШ) и А. Кирзюк (РАНГХиГС) — первое антропологическое и фольклористическое исследование, посвященное страхам советского человека. Многие из них нашли выражение в текстах и практиках, малопонятных нашему современнику: в 1930‐х на спичечном коробке люди выискивали профиль Троцкого, а в 1970‐е передавали слухи об отравленных американцами угощениях. В книге рассказывается, почему возникали такие страхи, как они превращались в слухи и городские легенды, как они влияли на поведение советских людей и порой порождали масштабные моральные паники. Исследование опирается на данные опросов, интервью, мемуары, дневники и архивные документы.

Александра Архипова , Анна Кирзюк

Документальная литература / Культурология
Советская внешняя разведка. 1920–1945 годы. История, структура и кадры
Советская внешняя разведка. 1920–1945 годы. История, структура и кадры

Когда в декабре 1920 года в структуре ВЧК был создано подразделение внешней разведки ИНО (Иностранный отдел), то организовывать разведывательную работу пришлось «с нуля». Несмотря на это к началу Второй мировой войны советская внешняя разведка была одной из мощнейших в мире и могла на равных конкурировать с признанными лидерами того времени – британской и германской.Впервые подробно и достоверно рассказано о большинстве операций советской внешней разведки с момента ее создания до начала «холодной войны». Биографии руководителей, кадровых сотрудников и ценных агентов. Структура центрального аппарата и резидентур за рубежом.В формате PDF A4 сохранен издательский макет книги.

Александр Иванович Колпакиди , Валентин Константинович Мзареулов

Военное дело / Документальная литература
Курская битва. Наступление. Операция «Кутузов». Операция «Полководец Румянцев». Июль-август 1943
Курская битва. Наступление. Операция «Кутузов». Операция «Полководец Румянцев». Июль-август 1943

Военно-аналитическое исследование посвящено наступательной фазе Курской битвы – операциям Красной армии на Орловском и Белгородско-Харьковском направлениях, получившим наименования «Кутузов» и «Полководец Румянцев». Именно их ход и результаты позволяют оценить истинную значимость Курской битвы в истории Великой Отечественной и Второй мировой войн. Автором предпринята попытка по возможности более детально показать и проанализировать формирование планов наступления на обоих указанных направлениях и их особенности, а также ход операций, оперативно-тактические способы и методы ведения боевых действий противников, достигнутые сторонами оперативные и стратегические результаты. Выводы и заключения базируются на многофакторном сравнительном анализе научно-исследовательской и архивной исторической информации, включающей оценку потерь с обеих сторон. Отдельное внимание уделено личностям участников событий. Работа предназначена для широкого круга читателей, интересующихся военной историей.

Петр Евгеньевич Букейханов

Военное дело / Документальная литература