Как упоминалось выше, создание эффективной схемы кодирования является ключевой особенностью работы проекта Seshat. Если определения переменных слишком расплывчаты, слишком абстрактны или требуют избыточного истолкования, то их становится трудно кодировать, и шансы на то, что между кодировщиками возникнут разногласия, возрастают. Например, собирая данные в Seshat, мы избегаем навязывания информации о прошлых обществах в произвольном режиме (например, «оцените социальную сложность этого общества по шкале от 0 до 10»). Перед сбором данных мы проводим семинар, обычно с участием экспертов, развивая понимание того, как кодировать ту или иную переменную, которую мы стремимся зафиксировать в Seshat. Вообще говоря, мы рассчитываем использовать количественную переменную (например, оценку численности населения государства) или разбить сложные переменные на несколько простых переменных, которые можно закодировать бинарным образом (отсутствует/присутствует и т. д.). Первоначальная схема кодирования затем тестируется ассистентами, которые применяют ее к нескольким примерам, работая в сотрудничестве с экспертами. Затем схема кодирования уточняется на основе предложений экспертов и ассистентов и применяется ко всей выборке. Иногда мы понимаем, что должны скорректировать схему кодирования после того, как значительное количество информации уже было закодировано с использованием старой схемы. Переход к лучшим определениям отчасти лишает процесс эффективности, поскольку ассистентам приходится возвращаться к уже закодированным сведениям и перекодировать их с использованием новой схемы. Этот процесс требует времени, и такие старые коды иногда задерживаются в базе данных, пока в конце концов не будут выявлены и исправлены.
Прежде чем использовать данные Seshat в статистическом анализе, мы проводим систематическую проверку их качества. Каждый параметр проверяется ассистентом – но не тем, который вводил информацию.
Seshat – громадная, сложная, «живая» сущность, которая постоянно развивается. В таком большом и многогранном проекте, как Seshat, при наличии столь обширной базы данных неизбежно возникают некоторые практические ограничения на получение точных или репрезентативных значений и кодов для конкретных переменных, потому что, например, конкретный фрагмент информации был опубликован в неизвестном источнике или есть новые сведения, о которых мы пока не знаем, но которые изменяют закодированное значение. Мы не ждем, пока закончится процесс «очищения», потому что он не заканчивается никогда. Если коротко, наш подход заключается в том, чтобы справляться с оставшимися проблемами по мере их выявления, постепенно улучшая базу данных; при этом мы понимаем, что в данных всегда будут какие-то ошибки. Предложения и критический анализ со стороны других ученых очень полезен в этом отношении. Мы все выиграем, если вынесем эти вопросы на всеобщее обозрение: систематический характер Seshat помогает сосредоточить обсуждение и определить точки разногласий и сомнений и пробелы в знаниях. Кроме того, по мере появления новых исторических и археологических сведений мы стараемся включать их в Seshat.
База данных CrisisDB
До 2020 года основным направлением нашей работы и статистического анализа собранных данных был ответ на один конкретный вопрос. В начале голоцена, приблизительно десять тысяч лет назад, все люди обитали в относительно эгалитарных малых сообществах численностью в сотни или несколько тысяч человек. Сегодня почти все люди (за исключением нескольких коренных групп в Амазонии и других отдаленных местах) живут в крупных обществах, причем два из них, Китай и Индия, имеют население, превышающее один миллиард человек. Новая форма политической организации, государство, возникла в середине голоцена и к настоящему времени завладела миром. Технологии стали очень сложными, а экономика сделалась высокопродуктивной, что повысило качество жизни многих людей. С другой стороны, возросшее благосостояние распределялось неравномерно, а сложные общества как в прошлом, так и сегодня крайне неравны. Главный вопрос, на который мы хотели ответить, заключался в следующем: как и почему произошла эта «великая голоценовая трансформация»? Хотя я не могу утверждать, что мы ответили на этот вопрос к всеобщему удовлетворению, мы определенно добились большого прогресса. Многие теории, предложенные современными социологами, а также великими философами прошлого, были отвергнуты на основании данных, собранных проектом Seshat. По мере того, как поле поддерживаемых теорий сужается, мы все лучше понимаем движущие силы, которые превратили наши общества в сегодняшнюю картину .