Фрайер был одним из авторов работы под названием «Причины разрыва в оценках между черными и белыми учениками в течение первых двух лет обучения в школе». В этой работе впервые были проанализированы новые данные правительственного исследования, что помогло разобраться с причинами разрыва в оценках по существу. Не менее интересно, что эти данные позволили дать ответ на вопрос, интересующий всех родителей (как белых, так и черных): какие факторы влияют на результаты учебы ребенка в школе, а какие – нет.
В конце 1990‑х годов Департамент образования США запустил широкомасштабный проект под названием Early Childhood Longitudinal Study (ECLS). Цель этого проекта заключалась в измерении прогресса в учебе среди более чем 20 тысяч детей, начиная с детского сада и заканчивая пятым классом. Для исследования использовались данные по всей стране – это было сделано для того, чтобы адекватно отразить весь многообразный состав американских школьников.
В рамках ECLS измерялись результаты учебы школьников и собиралась обычная для опросов информация по каждому участнику: раса, пол, состав семьи, социально-экономическое положение, образовательный уровень родителей и т. д. Однако исследование пошло значительно дальше. В ходе его проводились интервью с родителями школьников (а также учителями и представителями школьной администрации). В интервью им предлагалось дать ответы на значительное количество вопросов, носивших более личный характер, чем вопросы типичного интервью. Вопросы были примерно такими: шлепали ли вы детей, и если да, то как часто; ходите ли вы с детьми в музеи или библиотеки; как часто ваши дети смотрят телевизор.
В результате работы появился невероятно интересный набор данных, способный (при правильной работе с ним) рассказать потрясающие истории.
Для этого используется один из самых любимых инструментов экономистов: регрессионный анализ. Если вам кажется, что регрессионный анализ каким-то образом связан с лечением психиатрических заболеваний, то вы ошибаетесь. На самом деле это мощный (хотя и не всесильный) инструмент, использующий статистические техники для выявления не всегда заметной корреляции.
В условиях идеального мира экономист мог бы провести эксперимент так же, как это делают биологи или физики: сформировать две выборки, проделать по отношению к ним какие-нибудь действия, а затем оценить получившийся результат. Однако у экономистов крайне редко возникает такая роскошная возможность провести чистый эксперимент (вот почему мы считаем эксперимент со школьной жеребьевкой в Чикаго столь редкой удачей). Обычно в распоряжении экономиста имеется набор данных с огромным количеством переменных, иногда связанных между собой, а иногда нет. Экономист вынужден нырять в эту пучину данных для того, чтобы понять, какие из факторов действительно коррелируют между собой.
Что же касается данных ECLS, то задание с применением регрессионного анализа можно изобразить следующим образом: представим себе каждого из 20 тысяч школьников в виде набора электрических переключателей, расположенных на огромной панели. Каждый переключатель отображает ту или иную категорию данных, описывающих школьника: его оценки по математике или чтению в первом и третьем классах, уровень образования его матери, уровень дохода его отца, количество книг в доме, средний уровень достатка в районе его проживания и т. д.
Теперь исследователь может вычленить из этого сложного набора данных те или иные факторы. Он может сопоставить между собой всех детей со сходными характеристиками, то есть одинаково расположенные переключатели, а затем определить, по каким характеристикам они