В главе 3 мы фокусируемся на наших контрольных данных, которые относительно консервативны и обеспечивают промежуточные уровни неравенства в диапазоне вариантов, которые мы рассматриваем. Следует подчеркнуть, что во всех возможных вариантах число налогоплательщиков с очень высоким уровнем дохода намного выше по данным налогообложения, чем в данных самоотчетных опросов, так что наши исправленные оценки неравенства (и, в частности, наши исправленные 10% и 1% долей дохода) намного больше, чем предполагают необработанные данные обследований. Понятно, что имеющиеся в России таблицы налогов подоходного налога несовершенны, что и очевидно для такой страны. Публикация улучшенных таблиц позволила бы построить более точные и подробные оценки неравенства доходов в России, но российское правительство вероятнее всего на это никогда не пойдет.
Насколько нам известно, впервые в России используются статистические данные о налогах на прибыль в России (которые доступны на веб-сайте российских налоговых органов). Некоторые исследователи использовали образец деклараций о доходах на индивидуальном уровне из города Москвы, который был датирован 2004 годом. В выборке содержится гораздо больше информации, чем в таблицах, которые мы используем в этой статье, но, к сожалению, данные не были общегосударственными и охватывали лишь несколько лет. Что обнадеживает для наших целей, так это то, что данные в Москве привели к количественным результатам, которые в целом сходны с тем, что мы находим здесь: коэффициент Джини подскочил с 0,3-0,4 в данных самоотчетных опросах до более 0,6 с использованием данных утечки налогов и верхняя 10%-я доля дохода переместилась с 30% до более чем 50% от общего дохода. Все данные о таблицах национального подоходного налога и итоговые оценки приведены в онлайн-приложении. Что касается данных обследований домашних хозяйств, мы используем данные обследований RLMS (за период 1994-2015 гг.) и данные обследования HBS за предыдущие годы (данные HBS доступны в течение периода 1989-2015 гг., сопоставимые советские исследования проводились в 1980, 1985 и 1988 гг., и мы также используем их). Оба обследования (RLMS и HBS) имеют хорошо известные преимущества и жуткие недостатки. Мы предполагаем, что они обеспечивают приемлемое описание распределения доходов ниже 90-го процентиля (p0 = 0,9). Для использования таблиц подоходного налога, доступных в течение периода 2008-2015 годов, мы применяем обобщенные методы интерполяции Парето (Blanchet, Fournier and Piketty 2017) и кусочно-линейные поправочные коэффициенты f (p) выше p0 до процентилей, предоставляемых налоговых данных, чтобы исправить верхнюю часть распределения (аналогично методу, используемому Piketty-Yang-Zucman 2017, и описана в Alvaredo et al., 2016). Получающееся в результате увеличение коэффициентов Pareto верхнего дециля используется для корректировки оценочных размеров Парето в период 1980-2007 годов. По сути, это приводит к небольшим восходящим корректировкам неравенства в необработанном исследовании в период 1980-1990 годов и постепенному увеличению корректировок вверх после 1990 года. Наконец, мы используем табличные данные из советских доходов, которые уже велись и использовались в течение 1928, 1934, 1956, 1959 гг. и регулярно до 1989 г. другими исследователями (см., в частности, Бергсон, 1942, 1944, и основные работы Аткинсона и Миклуота 1992 г., которые предоставляют обширную коллекцию неплохих обзоров, где вы найдете данные для России и стран Восточной Европы при коммунизме, см. также Флемминг и Миклуарт 2000, опрос).
Чтобы обеспечить сравнение с досоветским неравенством, мы также используем таблицу распределения доходов, которая была оценена царскими налоговыми органами на 1905 год в рамках подготовки к возможному введению подоходного налога (который, разумеется, не был введен, поэтому это нельзя сравнивать с фактическими данными). Как мы объясняем в главе 3, точность полученной оценки не должна считаться особенно большой, хотя порядки величины кажутся нам правдоподобными.
2.2.3. Данные распределения богатства.
Мы также предоставляем данные распределения богатства для России в период 1995-2015 годов (которую мы затем используем для распределения освобожденных от налогов доходов от капитала). Чтобы построить эти оценки, мы используем данные Forbes и применяем обобщенные методы интерполяции Парето. Здесь есть два замечания.