Рассмотрим личность. Сколько существует измерений человеческой личности? В английском языке есть головокружительный список возможных описаний: покладистый, гибкий, самокритичный, добрый, прощающий, творческий, харизматичный, спокойный, умный, дисциплинированный, агрессивный, дотошный, серьезный, умный и так далее, и так далее, и так далее. Каждую из этих черт можно рассматривать как отдельное измерение, и каждый человек описывается местом в этом высокоразмерном пространстве личности в зависимости от того, какие баллы он набрал по ним. Но есть некоторые черты личности, которые, похоже, коррелируют между собой. "Умные" люди могут также часто считаться "быстро соображающими". Возможно, было бы правильнее рассматривать сообразительность и быстроту мышления как два показателя одной и той же базовой черты - возможно, мы назовем ее "интеллектом". Если это так, то два измерения, представляющие сообразительность и быстроту мышления в этом пространстве, можно заменить одним для интеллекта. Это уменьшит размерность. Если есть только случайные люди, которые умны, но не быстро соображают, или быстро соображают, но не умны, то это сокращение не принесет больших жертв. Для подавляющего большинства людей описание их по одному только интеллекту скажет нам все, что мы должны знать об этих аспектах их личности.
Действительно, большинство популярных тестов личности основаны на предпосылке, что всего несколько основных черт могут объяснить все человеческое разнообразие. Например, знаменитый тест Майерс-Бриггс утверждает, что личность имеет всего четыре оси: интуиция против чувствительности, чувства против мышления, интроверсия против экстраверсии и восприятие против суждения. Более научно обоснованный подход (известный как "Большая пятерка") определяет размерность личности по пяти осям: согласованность, невротизм, экстраверсия, добросовестность и открытость. Эти факторы называют "латентными", поскольку их можно рассматривать как основные базовые черты, которые порождают множество различных стилей личности, которые мы наблюдаем.
Исторически сложившаяся в нейронауке традиция рассматривать каждый нейрон как снежинку - уникальную и достойную индивидуального анализа - предполагает, что они в каком-то смысле являются базовой единицей мозга. То есть предполагается, что природа упаковала соответствующие измерения в аккуратную клеточную форму. Но точно так же, как наши народные представления о личности преувеличивают ее размерность, существует множество причин, по которым "истинная" размерность нейронной популяции, скорее всего, меньше, чем количество нейронов в ней. Например, избыточность - разумное свойство, которое должно присутствовать в любой биологической системе. Нейроны шумят и могут погибнуть, поэтому система с избыточными нейронами более надежна. Кроме того, нейроны, как правило, сильно взаимосвязаны. Вряд ли какой-либо из них может оставаться независимым, поскольку все они переговариваются друг с другом. Вместо этого их активность становится коррелированной, подобно тому, как сближаются мнения людей, принадлежащих к одному социальному кругу. По этим причинам нейронные популяции как нельзя лучше подходят для применения методов снижения размерности, которые помогут выявить скрытые факторы, действительно движущие ими.
Популярным методом снижения размерности нейронных данных является анализ главных компонент, или PCA (см. рис. 19). PCA был изобретен в 1930-х годах и широко использовался психологами для анализа психических свойств и способностей. Благодаря своей полезности для осмысления больших наборов данных он теперь применяется для всех видов данных во многих областях.
PCA работает за счет фокусировки на дисперсии. Дисперсия означает, насколько разбросаны различные точки данных. Например, если в течение трех ночей человек спит 8 часов, 8 часов и 5 минут и 7 часов и 55 минут, то он относится к категории людей с низкой дисперсией. Человек с высокой дисперсией сна тоже может спать в среднем 8 часов, но распределять их по трем ночам будет совсем по-другому - скажем, 6 часов, 10 часов и 8 часов.
Показатели с высокой дисперсией важны, потому что они могут быть весьма информативны. Например, легче определить эмоциональное состояние человека, который иногда молчит, а иногда кричит, чем стоика, у которого всегда одно и то же прямое лицо. Точно так же легче классифицировать людей по чертам, которые сильно различаются между собой, а не по тем, которые у всех общие. Признавая важность дисперсии, цель PCA - найти новые измерения, которые являются комбинацией исходных измерений, подобно тому как интеллект может быть комбинацией сообразительности и быстроты мышления, и которые отражают как можно большую дисперсию в данных. Это означает, что, зная, куда попадает точка данных в соответствии с этими новыми измерениями, мы сможем многое о ней узнать, даже если их будет меньше.