Коэффициент Джини любят за то, что это достаточно простой и понятный статистический показатель. Может показаться, что он совсем не простой, но, поверьте, так выглядит практически вся статистика, связанная с произвольной численностью населения (а часто даже хуже). Вот, например, формула совершенно обыкновенного стандартного отклонения:
А вот Джини:
Он куда безобиднее, чем кажется, честно!
Что же не так с коэффициентом Джини? На самом деле много чего. Его недостатки описаны во множестве статей, так что здесь я сосредоточусь на одном. На мой взгляд, этому изъяну уделяли недостаточно внимания при обсуждении Джини в целом, и он непосредственно связан с анализом неравенства в интернет-сообществах вроде блокчейна. Этот недостаток заключается в том, что коэффициент Джини объединяет в единый показатель неравенства две совершенно разные проблемы: проблему страданий из-за нехватки ресурсов и проблему концентрации власти.
Чтобы лучше понять разницу между этими проблемами, рассмотрим два антиутопических сценария.
▓ Антиутопия А: половина населения поровну делит между собой все ресурсы, а у второй половины не остается ничего.
▓ Антиутопия Б: половина ресурсов попадает в руки одного человека, а население делит оставшееся поровну между собой.
Вот кривые Лоренца (выпуклая диаграмма, которую мы видели выше) для обеих антиутопий.
Очевидно, что в обоих мирах жизнь сложится непростая, но непростая по-разному. Житель антиутопии А попадет либо в левую половину с невообразимым и ужасающим массовым голодом, либо в правую, где царит эгалитарная гармония. Если вы Танос[85], вам вполне может там понравиться! В ином случае лучше обходить это место стороной. Антиутопия Б, в свою очередь, напоминает «Дивный новый мир»: у всех вполне достойная жизнь (по крайней мере, на тот момент, когда фиксируются данные о богатстве), но за нее приходится платить крайне недемократической структурой власти, где вся надежда на то, что правитель окажется хорошим. Если вы Кёртис Ярвин[86], вам вполне может там понравиться! В ином случае, опять же, лучше обходить такое место стороной.
Это достаточно разные проблемы, поэтому нужно измерять и анализировать их по отдельности. Причем они различаются не только теоретически. Вот диаграмма, сравнивающая долю общего дохода нижних 20 % (довольно надежный показатель удаленности от антиутопии А) с долей общего дохода верхнего 1 % (довольно надежный показатель приближенности к антиутопии Б).
Источники: https://data.worldbank.org/indicator/SI.DST.FRST.20 (смешанные данные за 2015 и 2016 годы) и http://hdr.undp.org/en/indicators/186106
Показатели явно коррелируют (коэффициент –0,62), но очень далеки от идеальной корреляции (верховные жрецы статистики, если я не ошибаюсь, считают 0,7 нижним порогом «высокой корреляции», а мы не добрались даже до него). В диаграмме есть интересное и достойное отдельного анализа второе измерение: в чем разница между страной, где верхний 1 % зарабатывает 20 % от общего дохода, а нижние 20 % – 3 %, и страной, где верхний 1 % зарабатывает 20 %, а нижние 20 % – 7 %? Увы, эти изыскания я лучше оставлю более опытным исследователям данных и культуры.
Проблема концентрации богатства в блокчейне тоже актуальна и заслуживает отдельных измерений и анализа. Это важно для блокчейн-сообщества в целом, поскольку многие люди (и Сенат США на своих слушаниях[87]) пытаются выяснить, действительно ли криптография так антиэлитарна или она просто заменяет старые элиты новыми. Показатель концентрации богатства также важен при сравнении различных криптовалют.
Доля монет первоначального предложения криптовалюты, изначально выделенная отдельным инсайдерам, – один из типов неравенства. Обратите внимание, что данные об Ethereum не совсем точны: доли инсайдеров и фонда должны составлять 12,3 и 4,2 %, а не 15 и 5%
С учетом повышенного внимания к этим проблемам неудивительно, что многие пытались вычислить индексы Джини для криптовалют. И не все результаты оказались так плохи, как уверяла сенсационная статья 2014 года.
Помимо понятных и банальных методологических ошибок (смешивание неравенства в доходах с неравенством в богатстве, смешивание пользователей с учетными записями или и то и другое) использование коэффициента Джини для такого рода сравнений связано с более глубокой и не вполне очевидной проблемой. Эта проблема кроется в ключевом различии между типичными географическими сообществами (например, городами или странами) и типичными интернет-сообществами (например, блокчейном).