Приведенные матрицы позволяют интерпретировать компоненты как индикаторы использования определенных пространственных стратегий, которые используются испытуемыми в разной степени. Первая компонента может быть интерпретирована как показатель приверженности стратегии «не использовать горизонтальные переходы и использовать вертикальные». Вторая компонента – как показатель приверженности стратегии «использовать вертикальные переходы в правой нижней части матрицы Равена».
Обучение модели заключается в настройке ее параметров таким образом, чтобы получаемые предсказания значений целевой переменной отличались от реальных измеренных значений как можно меньше в терминах используемой меры ошибки. Освещение тех или иных алгоритмов обучения предсказательных моделей, равно как и подходов к оценке ее обобщающей (предсказательной) способности (напр., методика скользящего контроля), подробности методов распознавания образов и такого научного направления, как машинное обучение, можно уточнить, например, в соответствующих изданиях (Воронцов, 2007; Лепский, Броневич, 2009; Alpaydin, 2010).
Обученная модель в случае высокой степени ее предсказательной способности может успешно использоваться для предсказания значений целевых переменных: как дискретных категорий испытуемых (таких как, напр., индикатор правильности выполненного задания теста способностей, пол испытуемого, уровень навыка чтения), так и соответствующих им непрерывных случайных величин (таких, напр., как возраст, итоговый балл по тесту).
В случае деревьев решений объяснение может строиться путем выписывания последовательности условий, проверенных для данного испытуемого на пути от корня дерева до листа. Эти условия образуют конъюнкцию, т. е. легко интерпретируемое логическое правило (Воронцов, 2007). Пример дерева, построенного с использованием выборки значений интерпретированных выше главных компонент SR-матриц и предсказывающего успешность выполнения задания теста Равена, приведен на рисунке 5.
Рис. 5
. Дерево классификации, позволяющее правильно (в 70 % случаев) предсказывать результат выполнения задания («Выполнил верно» – «Pass» и «Выполнил неверно» – «NotPass») по величинам главных компонент «Horis» («He использовать горизонтальные переходы и использовать вертикальные») и «Vertic» («Использовать вертикальные переходы в правой нижней части матрицы Равена»)В целом данное дерево можно интерпретировать следующим образом: если испытуемый придерживается определенных стратегий глазодвигательной активности, то скорее всего задания теста Равена будут пройдены успешно. Однако, если испытуемый зацикливается при рассмотрении элементов матрицы задания по углам, т. е. в верхней левой либо в нижней правой частях, то, вероятно, он не может установить зависимость между элементами матрицы задания и само задание пройдено не будет.
В случае применения линейных регрессионных моделей или дискриминантных функций выявление значимых объясняющих признаков также не составляет труда (достаточно воспользоваться подходящими статистическими критериями значимости коэффициентов модели), а их интерпретация зависит от абсолютной величины коэффициента и знака при нем.
В ходе проекта было разработано программное обеспечение, позволяющее психологу проводить анализ экспериментальных данных видеоокулографии с помощью рассмотренного метода статистического анализа и методов выделения информативных признаков (в том числе и скрытых), не имея при этом глубоких познаний ни в математике, ни в программировании, точнее, при минимальных познаниях в данных областях. На данный момент на языке R (R Core Team, 2014) программно реализованы (автор – Борислав Поляков, выпускник факультета информационных технологий МГППУ):