Читаем mixOmics для гуманитариев полностью

•             Контролируемый анализ: метод включает вектор, указывающий на принадлежность класса в каждой выборки. Цель его состоит в том, чтобы различать выборочные группы и выполнять прогнозирование для класса выборки. Примерами контролируемых методов являются дискриминантный анализ проекций на скрытые компоненты (PLS-DA), анализ интеграции данных для обнаружения маркеров с использованием скрытых компонентов (DIAB), а также многомерный интегративный метод определения воспроизводимых сигнатур в независимых экспериментах на разных платформах (MINT).

Перечень широко используемых методов mixOmics, которые будут подробно описаны в соответствующих главах ниже, за исключением CCA и MINT, можно представить следующей таблицей типов и объема данных, который они могут обрабатывать:



Методы, реализованные в mixOmics, подробно описаны в разных публикациях, обширный список которых постоянно пополняется и может быть найден в открытых источниках.

В следующей таблице приведён список методов mixOmics, наличие разрежения в которой указывает на методы, предполагающие осуществление выбора переменных:



Основные функции и параметры каждого метода сведены в следующей таблице:



Каждый раздел, посвященный описанию того или иного метода, излагается по следующему плану:

1. Тип педагогического вопроса, на который нужно ответить.

2. Краткое описание иллюстративного набора данных.

3. Принцип метода.

4. Быстрый запуск метода с основными функциями и аргументами.

5. Чтобы идти дальше: настраиваемые опции, дополнительные графические построения и настройки параметров.

6. Вопросы и ответы.

Глава 1. Первые шаги

Как путь в тысячу миль начинается с первого шаг, так и использование любого пакета R начинается с его установки. Во-первых, можно скачать последнюю версию mixOmics  от Bioconductor следующей командой:

if (!requireNamespace("BiocManager", quietly = TRUE))

install.packages("BiocManager")

BiocManager::install("mixOmics")

Кроме того, можно установить последнюю версию пакета с GitHub, но для этого понадобится предварительная установка пакета remotes:

BiocManager::install("remotes")

BiocManager::install("mixOmicsTeam/mixOmics")

Пакет mixOmics напрямую импортирует следующие пакеты: igraph, rgl, ellipse, corpcor, RColorBrewer, plyr, parallel, dplyr, tidyr, reshape2, methods, matrixStats, rARPACK, gridExtra. Если возникнут затруднения при установке пакета rgl, то нужно будет дополнительно установить программное обеспечение X'quartz.

Загрузить установленный пакет можно следующей командой:

library(mixOmics)

Убедитесь, что при загрузке пакета не возникло ошибки, особенно для упомянутой выше библиотеки rgl. В примерах, которые будут приведены далее, используются данные, являющиеся частью пакета mixOmics. Чтобы загрузить свои собственные данные, проверьте установлен ли рабочий каталог, а затем считайте данные из формата .txt    или .csv, либо с помощью пункта меню импортирования данных в RStudio, либо через одну из следующих командных строк:

# из файла csv

data <– read.csv("имя_файла.csv", row.names = 1, header = TRUE)

# из файла txt

data <– read.table("имя_файла.txt", header = TRUE)

Для получения более подробной информации о аргументах, используемых для настройки параметров этих функций, введите ?read.csv или ?read.table в консоли R.

Каждый анализ должен выполняться в следующем порядке:

1. Запустите выбранный метод анализа.

2. Выполните графическое представление образцов.

3. Выполните графическое представление переменных.

Затем используйте критическое мышление и дополнительные функции инструментов визуализации, чтобы разобраться в полученных данных. Некоторые из вспомогательных инструментов будут описаны в следующих главах.

Например, для анализа основных компонентов сначала загружаем данные:

My_table <– structure(list(Класс = c("7а", "7а", "7а", "7а", "7а", "7а", "7а", "7а", "7а",

"7а", "7б", "7б", "7б", "7б", "7б", "7б", "7б", "7б", "7б", "7б", "эталон", "отстающий"),

`Фимилия Имя` = c("Иванов Иван", "Петров Петр", "Сидоров Сидор", "Егоров Егор",

"Романов Роман", "Николаев Николай", "Григорьев Григогий", "Викторов Виктор",

"Михайлов Михаил", "Тимуриев Тимур", "Ульянова Ульяна", "Ольгина Ольга",

"Людмилова Людмила", "Дарьева Дарья", "Кристинина Кристина",

"Натальина Наталья", "Глафирова Глафира", "Янина Яна", "Иринова Ирина",

"Валентинова Валентина", "Идеальный ученик", "Другая крайность"), Тема1 = c(5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 1), Тема2 = c(2, 3, 3, 2, 2, 3, 3, 2, 2, 3, 4, 5, 5, 4, 4, 4, 5, 5, 4, 5, 5, 1), Тема3 = c(1, 2, 2, 1, 1, 2, 2, 1, 2, 2, 1, 2, 2, 1, 1, 2, 2, 2, 1, 2, 5, 1), Тема4 = c(4, 5, 5, 4, 4, 4, 5, 5, 5, 4, 5, 5, 4, 4, 5, 5, 4, 4, 5, 4, 5, 1), `Тема 5` = c(1, 2, 2, 2, 1, 2, 1, 1, 2, 2, 1, 2, 2, 1, 1, 2, 2, 1, 2, 5, 5, 1), `№№` = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22)), row.names = c(NA, -22L), class = c("tbl_df", "tbl", "data.frame"))

Затем выполним следующие шаги:

My_result.pca <– pca(My_table) # 1 Запуск выбранного метода анализа

Перейти на страницу:

Похожие книги

История Французской революции. Том 1
История Французской революции. Том 1

Луи-Адольф Тьер (1797–1877) – политик, премьер-министр во время Июльской монархии, первый президент Третьей республики, историк, писатель – полвека связывают историю Франции с этим именем. Автор фундаментальных исследований «История Французской революции» и «История Консульства и Империи». Эти исследования являются уникальными источниками, так как написаны «по горячим следам» и основаны на оригинальных архивных материалах, к которым Тьер имел доступ в силу своих высоких государственных должностей.Оба труда представляют собой очень подробную историю Французской революции и эпохи Наполеона I и по сей день цитируются и русскими и европейскими историками.В 2012 году в издательстве «Захаров» вышло «Консульство». В 2014 году – впервые в России – пять томов «Империи». Сейчас мы предлагаем читателям «Историю Французской революции», издававшуюся в России до этого только один раз, книгопродавцем-типографом Маврикием Осиповичем Вульфом, с 1873 по 1877 год. Текст печатается без сокращений, в новой редакции перевода.

Луи Адольф Тьер , Луи-Адольф Тьер

История / Учебная и научная литература / Образование и наука
Исторические информационные системы: теория и практика
Исторические информационные системы: теория и практика

Исторические, или историко-ориентированные, информационные системы – значимый элемент информационной среды гуманитарных наук. Его выделение связано с развитием исторической информатики и историко-ориентированного подхода, формированием информационной среды, практикой создания исторических ресурсов.Книга содержит результаты исследования теоретических и прикладных проблем создания и внедрения историко-ориентированных информационных систем. Это первое комплексное исследование по данной тематике. Одни проблемы в книге рассматриваются впервые, другие – хотя и находили ранее отражение в литературе, но не изучались специально.Издание адресовано историкам, специалистам в области цифровой истории и цифровых гуманитарных наук, а также разработчикам цифровых ресурсов, содержащих исторический контент или ориентированных на использование в исторических исследованиях и образовании.В формате PDF A4 сохранен издательский макет.

Динара Амировна Гагарина , Надежда Георгиевна Поврозник , Сергей Иванович Корниенко

Зарубежная компьютерная, околокомпьютерная литература / Учебная и научная литература / Образование и наука