Читаем Метод. Московский ежегодник трудов из обществоведческих дисциплин. Выпуск 4: Поверх методологических границ полностью

Метод главных компонент (МГК) был предложен К. Пирсоном в 1901 г. и сейчас активно применяется во множестве естественных и социальных наук. С его помощью можно сжать изображения и видео, отделить значимую информацию от «шума», описать бактериальные геномы, составить индексы состояния окружающей среды, инвестиционной привлекательности регионов или коррупции в странах мира.

В МГК на входе имеется исходный набор признаков x (1), x (2), .., x (p), измеренных в количественной шкале, который содержит в себе информацию, и этой информацией является дисперсия исходных показателей. МГК позволяет значительно уменьшить размерность исходного признакового пространства с минимальными потерями путем избавления от дублирующейся информации, содержащейся в сильно коррелированных признаках. Результатом является свертка имеющихся переменных в новые, некоррелированные между собой (ортогональные) «компоненты» y1, y2, .., yp, первые несколько из которых объясняют большую долю общей дисперсии исходных признаков.

Полученная первая главная компонента y1 максимально объясняет дисперсию исходных признаков. Вторая главная компонента y2 объясняет максимально возможную долю оставшейся дисперсии и т.д. Доля дисперсии, которую объясняют последние компоненты, настолько мала, что от этих компонент можно отказаться без существенной потери информации. Количество компонент, которые будут извлечены по результатам МГК, зависит от исследователя и стоящей перед ним задачи. Существуют различные рекомендации относительно того, сколько главных компонент следует извлекать. Например, предлагается руководствоваться соображениями того, что извлеченные главные компоненты должны объяснять не менее 70–80% дисперсии исходных признаков [Analysis of multivariate social science data, 2008, р. 124]. Так или иначе важно, чтобы полученные компоненты могли быть содержательно интерпретированы. Интерпретация j компоненты осуществляется на основании того общего, что есть в частных критериях, объединенных в одну компоненту.

Многие категории политической науки являются сложными, многоаспектными, а возникающие при их формализации признаковые пространства – многомерными. Примерами таких признаков являются политические убеждения, государственная состоятельность [Стукал, Хавенсон, 2012], социально-экономический статус, уровень интеллекта и т.п., работа с ними требует обращения к методам измерения латентных переменных.

Методы измерения латентных переменных состоят в изучении взаимосвязей доступных для наблюдения показателей, отражающих некоторую латентную синтетическую категорию, и последующем моделировании ненаблюдаемых переменных. Допуская, что отдельные показатели могут характеризовать разные стороны ненаблюдаемого признака, мы принимаем тот факт, что их изменчивость во многом обусловлена изменчивостью латентного признака. Такая модель схожа с моделью регрессии и тоже содержит требования относительно распределения ошибок, но «отклик» в ней ненаблюдаем в принципе, поэтому о связи «предикторов» и «отклика» ничего нельзя утверждать однозначно.

Задача моделирования латентных переменных состоит в том, чтобы выяснить, можно ли наблюдаемую связь между несколькими переменными объяснить небольшим числом латентных признаков – факторов.

Самым первым и распространенным методом измерения латентных переменных является факторный анализ. Для его реализации требуется, чтобы и ненаблюдаемый «отклик», и наблюдаемые индикаторы были непрерывными величинами. Основным источником информации при этом является корреляционная матрица наблюдаемых переменных. Свои методы есть для категориальных признаков, а также для случаев признаков в разных шкалах [Стукал, Хавенсон, 2012, с. 244–246] (см. табл. 1).

Таблица 1

Классификация методов измерения латентных переменных

Источник: [Analysis of multivariate social science data, 2008, p. 177].

В факторном анализе выделяются два типа: разведывательный (exploratory) и подтверждающий (confirmatory). В первом типе не проводится проверка гипотез, он помогает проанализировать структуру связей в данных и сформулировать гипотезы, во втором типе, наоборот, проводится проверка гипотез о количестве факторов и нагрузках.

Перейти на страницу:

Похожие книги

115 сочинений с подготовительными материалами для младших школьников
115 сочинений с подготовительными материалами для младших школьников

Дорогие друзья!Сочинение – это один из видов работы по развитию речи, который предполагает самостоятельное, продуманное изложение вами своих мыслей в соответствии с требуемой темой.Работа над сочинением развивает мышление, речь, позволяет выразить свой взгляд на мир. Такой вид работы способствует осознанию окружающего мира, действительности, самих себя. Кроме того, сочинение учит аргументированно доказывать и отстаивать свою точку зрения.В данном пособии вы найдёте методику написания сочинений, а также различные виды сочинений с планами и подготовительными материалами.Не забывайте, что сочинение – это прежде всего творческая работа, которая не терпит шаблона. Советуем вам не использовать представленные в пособии сочинения для бездумного, механического переписывания их в свои тетради. Наши сочинения – это возможные варианты раскрытия определённых тем, которые, надеемся, помогут вам при создании самостоятельных текстов.Желаем успехов!

Ольга Дмитриевна Ушакова

Детская образовательная литература / Школьные учебники и пособия, рефераты, шпаргалки / Книги Для Детей