Рис. 11.5. Детальная карта, отражающая показатель электронный прибор/домохозяйство, демонстрирует один из возможных пространственных вариантов распределения показателя прибор/домохозяйство, которое может соответствовать и уровню города, и уровню округа, отображенным на рис. 11.1 и 11.2
Плохи ли по-настоящему агрегированные данные? Конечно нет. Во многих случаях, например в вопросах анализа публичной политики, города и округа являются наиболее подходящими единицами, которым штаты и федеральное правительство выделяют бюджеты и определяют результативность их деятельности. Даже данные, агрегированные на более высоком уровне, могут быть весьма полезными, скажем, когда губернаторы и сенаторы хотят сравнить какие-то показатели своего штата с остальными сорока девятью. Местные власти и социологи, озабоченные проблемой различий между соседними местностями, с готовностью признают ценность картографической агрегации. Более того, правила недопущения утечки данных, которые нужны для взаимодействия с учреждениями, занимающимися переписью населения и различными социальными обследованиями, требуют агрегации, и регионально агрегированные данные – это лучше, чем отсутствие всяких данных. Поэтому лица, зависящие от локальных данных, обычно побуждают Бюро переписи населения США к тому, чтобы оно видоизменяло границы административных единиц так, чтобы сохранялась однородность переписных районов[29]
и других учетных единиц. А когда данные по этим районам их не устраивают, они в отдельных случаях оплачивают объединение новых данных в более адекватные территориальные единицы.Что еще может сделать добросовестный аналитик? Немногое сверх того, что и так очевидно: знать территориальную единицу, экспериментировать с данными на различных уровнях агрегации и тщательно выверять все заключения.
А что должен делать скептически настроенный пользователь карт? Искать и сравнивать карты с различной степенью детализации и быть осторожным с картографическими злоумышленниками, которые выбирают такие уровни агрегации, которые выгодны только им самим.
На хороплетных картах картографические данные еще больше подвергаются агрегированию за счет объединения всех ареалов с одинаковыми показателями в одну категорию, обозначенную единым символом. Такой вид агрегирования решает проблему использования в картах более чем шести или семи визуально четко различимых цветов спектра или оттенков серого в логической последовательности от более светлого к более темному. Чаще всего составители карт предпочитают применять четыре или пять таких категорий, особенно тогда, когда имеющиеся пространственные символы не могут обеспечить однозначные значения на карте. Из эстетических соображений или для того, чтобы избежать неправильного понимания отображения внутренних озер и ареалов без каких-либо данных, в хороплетных картах обычно не применяется матово-белый и темно-черный цвета.
Такая классификация создает угрозу искажения пространственных тенденций на статистических картах. Произвольное установление разрывов между категориями может затушевать ясный и связный тренд на картах с ненужной фрагментацией участков или там, где вместо по необходимости сложной картины представляется ее излишне упрощенный вариант. Рис. 11.6 иллюстрирует влияние разрывов между категориями на хороплетной карте, представляющей соотношение электронный прибор/домохозяйство, отображенное на рис. 11.4. Обратите внимание на то, что левая карта дает ясное, однозначное и легко запоминающееся изображение тренда, который постепенно нарастает по направлению к правому верхнему углу региона. Напротив, правая карта представляет более фрагментированную картину одних и тех же данных.
Классификация порождает много вопросов. Какая из этих карт правильная (если вообще правильна хотя бы одна из них)? Или, если определение «правильная» звучит слишком догматично, какая из них дает лучшее отображение имеющихся данных? Не скрывают ли обе карты множество возможных вариаций в некоей третьей категории, представленной квадратами черного цвета? Не должны ли семь городов с показателем 0,2 быть вынесены в отдельную категорию? Является ли разница в 0,1 в нижнем сегменте значений более значимой, чем в верхнем сегменте? Может ли карта, отображающая три категории значений, быть хотя бы отдаленно подходящим решением?
Рис. 11.6. Разные значения в категориях соотношения прибор/домохозяйство производят две разные карты (в каждой по три группы символов), отображающие одни и те же данные, представленные на рис. 11.4
Рис. 11.7. Две ошибочные схемы классификации, которые используются в компьютерных программах, дают радикально отличающиеся картины для данных, отображенных на рис. 11.4