Читаем mixOmics для гуманитариев полностью

plotIndiv(My_result.pca) # 2 Визуальное представление образцов

plotVar(My_result.pca) # 3 Визуальное представление переменных

Это только первый пример, в дальнейшем появится много вариантов, из которых можно будет выбрать, наиболее соответствующий стоящим перед вами исследовательским задачам статистического анализа. Пакет mixOmics предлагает различные методы представления переменной и широкий выбор функций сбора информации на довольно больших наборах данных.

Сохраним числовые данные из исходной таблицы во вспомогательной переменной:

to.remove <– c('Фимилия Имя', 'Класс', '№№')

X <– My_table[, !colnames(My_table) %in% to.remove]

Следуя примеру выше, методы PCA могут быть применены для выбора первых пяти переменных, тесно связанных с первыми двумя компонентами в PCA. Пользователь определяет количество переменных, выбранных по каждому компоненту, например, здесь выберем пять переменных на каждом из первых двух компонентов командой keepX=c(5,5):

My_result.spca <– spca(X, keepX=c(5,5)) # 1 Запуск выбранного метода анализа

plotIndiv(My_result.spca) # 2 Визуальное представление образцов

plotVar(My_result.spca) # 3 Визуальное представление переменных



Можно заметить, что сократилось количество элементов на круге корреляции. Не останавливайтесь на достигнутом, находясь в начале большого пути. Можно улучшить наглядность представляемых результатов анализа следующим образом: загляните в справочное руководство по каждой из функций используемой в примерах, введя в консоли ?pca,  ?plotIndiv,  ?sPCA. Для запуска сопутствующих примеров можно использовать функцию example:  example(pca), example(plotIndiv), и другие.

Глава 2. Метод главных компонент (PCA)

Зададимся следующим вопросом: как определить основные источники различий в имеющихся данных, а после этого выяснить, соответствуют ли такие источники объективным условиям педагогического эксперимента или они образовались в результате предвзятости экспериментаторов? Попутно хотелось бы визуализировать основные тенденции и закономерности изменения значений между образцами, в частности, естественного характера, в соответствии с известными условиями педагогического наблюдения.

Так, например, исходные данные для анализа могут содержать таблицу с n рядами и p столбцами, соответствующими уровню успеваемости p студентов, измеренных на n курсах. Чтобы проиллюстрировать PCA, фокусируемся на уровнях успеваемости по темам, описанным в таблице данных My_table, сохранённой ранее.

Цель PCA заключается в том, чтобы уменьшить размерность данных, сохраняя при этом как можно больше информации, насколько это возможно. «Информация» здесь обусловлена дисперсией. Идея заключается в создании попарно несвязанных между собой вспомогательных переменных, называемых главными компонентами (PC), которые являются линейной комбинацией исходных (возможно, коррелирующих между собой) переменных (например, тематика контрольных работ и так далее).

Уменьшение размерности достигается за счет отображения исходных данных в пространство, порождаемое главными компонентами (PC). На практике это означает, что каждому образцу присваивается координата по каждому новому измерению PC – эта координата рассчитывается как линейная комбинация исходных переменных, с некоторыми весовыми коэффициентами. Вес каждой из исходных переменных хранится в так называемых векторах нагрузки, связанных с каждым образцом. Размер данных уменьшается за счет проецирования данных в подпространство меньшей размерности, порождаемое PC, при одновременном охвате крупнейших источников различий между образцами.

Главные компоненты получены таким образом, чтобы их дисперсия была максимальной. С этой целью вычисляются собственные векторы и собственные значения матрицы дисперсии-ковариации, часто с помощью алгоритмов линейного разложения значения, когда количество переменных достаточно велико. Данные, как правило, центруют (опцией center = TRUE), а иногда и масштабируют (scale = TRUE) при вызове метода. Масштабирование рекомендуется применять в том случае, если дисперсия неоднородна по переменным.

Первая главная компонента (PC1) определяется линейной комбинацией исходных переменных, что объясняет наибольшее количество вариаций. Вторая главная компонента (PC2) затем определяется как линейное сочетание исходных переменных, на которые приходится наибольшее количество оставшегося объема вариаций ортогонального (несвязанного) с первым компонентом. Последующие компоненты определяются также для других размерностей PCA. Таким образом, пользователь должен сообщить, сколько информации объясняется первыми ПК, поскольку они используются для графического представления выходов PCA.

Сначала загружаем данные. Чтобы загрузить свои собственные данные можно воспользоваться следующей командой:

My_result.pca <– pca(X) # 1 Запуск выбранного метода анализа

plotIndiv(My_result.pca) # 2 Визуальное представление образцов



plotVar(My_result.pca) # 3 Визуальное представление переменных



Перейти на страницу:

Похожие книги

История Французской революции. Том 1
История Французской революции. Том 1

Луи-Адольф Тьер (1797–1877) – политик, премьер-министр во время Июльской монархии, первый президент Третьей республики, историк, писатель – полвека связывают историю Франции с этим именем. Автор фундаментальных исследований «История Французской революции» и «История Консульства и Империи». Эти исследования являются уникальными источниками, так как написаны «по горячим следам» и основаны на оригинальных архивных материалах, к которым Тьер имел доступ в силу своих высоких государственных должностей.Оба труда представляют собой очень подробную историю Французской революции и эпохи Наполеона I и по сей день цитируются и русскими и европейскими историками.В 2012 году в издательстве «Захаров» вышло «Консульство». В 2014 году – впервые в России – пять томов «Империи». Сейчас мы предлагаем читателям «Историю Французской революции», издававшуюся в России до этого только один раз, книгопродавцем-типографом Маврикием Осиповичем Вульфом, с 1873 по 1877 год. Текст печатается без сокращений, в новой редакции перевода.

Луи Адольф Тьер , Луи-Адольф Тьер

История / Учебная и научная литература / Образование и наука
Исторические информационные системы: теория и практика
Исторические информационные системы: теория и практика

Исторические, или историко-ориентированные, информационные системы – значимый элемент информационной среды гуманитарных наук. Его выделение связано с развитием исторической информатики и историко-ориентированного подхода, формированием информационной среды, практикой создания исторических ресурсов.Книга содержит результаты исследования теоретических и прикладных проблем создания и внедрения историко-ориентированных информационных систем. Это первое комплексное исследование по данной тематике. Одни проблемы в книге рассматриваются впервые, другие – хотя и находили ранее отражение в литературе, но не изучались специально.Издание адресовано историкам, специалистам в области цифровой истории и цифровых гуманитарных наук, а также разработчикам цифровых ресурсов, содержащих исторический контент или ориентированных на использование в исторических исследованиях и образовании.В формате PDF A4 сохранен издательский макет.

Динара Амировна Гагарина , Надежда Георгиевна Поврозник , Сергей Иванович Корниенко

Зарубежная компьютерная, околокомпьютерная литература / Учебная и научная литература / Образование и наука
Война Алой и Белой розы. Крах Плантагенетов и воцарение Тюдоров
Война Алой и Белой розы. Крах Плантагенетов и воцарение Тюдоров

Автор бестселлеров «Тамплиеры» и «Плантагенеты» рассказывает об одной из самых захватывающих и трагических глав британской истории.В XV веке страна пережила череду длительных и кровопролитных гражданских войн. Корона Англии семь раз переходила из рук в руки, пока представители знатных родов боролись за право на власть. Дэн Джонс завершает свою эпическую историю средневековой Британии книгой о Войне Алой и Белой розы и показывает, как Тюдоры разгромили Плантагенетов и заполучили корону. Он ярко описывает блеск королевского двора и постигшие страну бедствия, интриги и заговоры, а также знаменитые сражения — и среди них битву при Таутоне, в которой погибло 28 000 человек, и при Босворте, где в бою пал последний король из династии Плантагенетов. Это реальные события, стоящие за знаменитыми историческими хрониками Шекспира, а также популярным сериалом Би-би-си и послужившие основой «Игры престолов».

Дэн Джонс

Военная история / Учебная и научная литература / Образование и наука