Ради уверенности в том, что все цифры имеют одинаковые шансы стать первой значащей цифрой числа, мы будем вести измерения в широком диапазоне. Например, давайте зададимся вопросом, насколько велико население разных стран[107]
. Это значение будет колебаться от миллиарда с лишним (Китай и Индия) до менее чем десяти тысяч (в случае с карликовым государством на коралловом острове Науру[108]). Вдобавок к численности населения давайте выясним следующие параметры для сотен государств:– валовой внутренний продукт (в долларах США);
– количество аэропортов;
– площадь (в квадратных километрах);
– ежегодную выработку электроэнергии (в киловатт-часах);
– ежегодное потребление продуктов нефтепереработки (в баррелях);
– общую длину всех железных дорог (в километрах);
– количество телефонов.
Таким образом, мы соберем около 2000 параметров и затем подсчитаем, сколько чисел начинается с цифры 1, сколько – с цифры 2 и т. д. Вот что у нас получится:
Невероятно: чаще всего на первой позиции встречается цифра 1 (примерно в 30 % случаев) и реже всего – цифра 9 (меньше 5 % случаев)!
Мы призываем читателей повторить эксперимент самостоятельно: взять статистический справочник, выписать первые цифры длин рек, высот гор, курсов акций, среднего роста различных видов животных, количества слов в романах, производства риса в разных странах и т. д.
Соберите как можно больше параметров, покрывающих широкий диапазон значений, и вы увидите все ту же логику. Чаще всего первой цифрой оказывается единица, реже всего – девятка.
Такое неравномерное распределение первых
Закон Бенфорда утверждает нечто большее, чем «единица на первой значащей позиции встречается чаще всего, а девятка – реже всего». Закон Бенфорда констатирует (при наличии большого количества данных) следующую частотность[111]
:Есть и другая область, где обнаруживается неравномерное распределение первых значащих цифр, – это знакомая всем таблица умножения[112]
:Среди 81 числа в этой таблице 18 начинаются на 1, а именно:
При этом всего 3 числа начинаются на 9:
Вот процентное соотношение первых значащих цифр в обычной таблице умножения.
Мы видим, что цифры поменьше встречаются чаще, чем цифры побольше, но частотность здесь не совсем такая, какую предсказывает закон Бенфорда.
Таблица умножения дает нам все возможные результаты умножения одного однозначного числа на другое от 1 × 1 до 9 × 9.
Давайте расширим этот принцип и переберем все варианты умножения трех однозначных чисел. Проделаем следующие вычисления[113]
:В общей сложности это дает 9³ = 729 троек. Посмотрим, как часто встречаются разные цифры в первой позиции:
Нет резона останавливаться на перемножении трех чисел. Мы можем составить четырехмерные, пятимерные, шестимерные таблицы умножения и т. д. Давайте сразу посмотрим, что получится с десятимерной таблицей умножения[114]
. Она содержит все возможные комбинации произведений десяти чисел от 1 до 9. Другими словами, мы проделываем следующие вычисления:Занесем в таблицу, как много чисел начинается с 1, 2 и т. д.:
Мы увидим, что частотность первых цифр в этом случае уже хорошо согласуется с законом Бенфорда.
Перед тем как вникнуть в детали закона Бенфорда, давайте обратим внимание на одно его практическое применение.
Предположим, некий нечистый на руку человек подделывает налоговые декларации (меняет суммы, фабрикует баланс и т. д.). Короче говоря, он лжет и выдумывает числа, не имеющие отношения к реальности. Начальные цифры он выбирает случайным образом.
Судебный эксперт может быстро проверить, совпадает ли распределение первых цифр с законом Бенфорда. Если не совпадает, возникают подозрения, что числа подделаны. Но это еще не строгое доказательство вины.
Сверхбольшие и сверхмалые числа удобно записывать в экспоненциальном виде. Например, число 12 300 000 в экспоненциальном представлении выглядит так: 1,23 × 10⁷. Мы записываем число от 1 до 10, умноженное на степень 10. Основное число называется
По определению, мантисса не может быть меньше одного и не может быть больше или равна десяти[116]
: 1 ≤Мантисса поможет нам сформулировать усовершенствованный вариант закона Бенфорда. Грубо говоря, закон гласит, что среди большого количества измерений около 30 % чисел имеют первую значащую цифру 1, то есть имеют мантиссу меньше 2.
Уточняя закон Бенфорда, мы можем присмотреться к первым двум цифрам большого количества измерений и задаться вопросом: с какой частотой мантисса будет, скажем, меньше 1,7? Вот другая формулировка того же вопроса: с какой частотой первые две цифры будут 10, 11, 12, 13, 14, 15 и 16?