А что, если человек не подготовлен ни к тому, чтобы увидеть связь, ни к тому, чтобы ее не увидеть?
Что произойдет, например, если человек слышит, как группа людей называет первую букву своего имени, потом они хором поют музыкальную ноту, а затем его спрашивают, есть ли какая-то связь между позицией этой буквы в алфавите и длительностью ноты?
Насколько высока должна быть корреляция между такими произвольно связанными событиями, чтобы люди гарантированно обнаружили ее?
Корреляция должна быть приблизительно равна 0,6 — чуть выше, чем корреляция 0,5, показанная на рисунке З[114]
. И это тогда, когда человек получает все данные сразу и изо всех сил старается понять, какая связь есть в данном случае. На деле это означает, что человек не может быть уверен, что между двумя величинами есть связь, если эта связь недостаточно сильна — она должна быть выше, чем многие из тех корреляций, на основе которых мы совершаем выбор в повседневной жизни. Чтобы сделать правильный вывод, нужно действовать систематически: наблюдать, записывать и делать расчеты, иначе окажется, что все ваши выводы — полная чушь.Точно распознать ковариацию очень трудно, но у этого правила есть одно важное исключение. Когда два события — даже сопоставленные преднамеренно — близки друг к другу по времени, ковариация обычно заметна. Если включать лампочку перед тем, как крыса получит удар электрическим током, крыса очень быстро заметит связь между светом и разрядом. Но даже когда речь идет о настолько явно связанных событиях, способность осознавать эту связь резко снижается с увеличением интервала времени между событиями. Ни животные, ни люди не улавливают связи между двумя намеренно связанными событиями, если интервал между ними превышает несколько минут.
Много лет назад мой друг и его жена хотели завести ребенка. После нескольких лет безуспешных попыток они в конце концов решили посетить врача. Новости оказались невеселыми. В его сперме было «слишком мало сперматозоидов, чтобы оплодотворение произошло естественным путем». Друг спросил у врача, насколько надежен этот анализ. «Очень надежен», — ответил доктор. Он имел в виду, что анализ не бывает ошибочным — он дает верные данные. Это не слишком точное значение термина «надежный».
Надежность измерения переменной величины есть степень воспроизводимости того же результата от измерения к измерению или при переходе от одного метода измерения к другому.
Надежность измерения роста человека практически равна 1 (почти абсолютная корреляция при разных замерах). Надежность измерения IQ с интервалом в пару недель — примерно 0,9, а измерение IQ с помощью двух разных тестов обычно дает надежность более 0,8. Два стоматолога придут к согласию по поводу степени здоровья вашего зуба с надежностью менее 0,8[115]
. Это означает, что доктор Смит запломбировал бы вам зуб, а доктор Джонс оставил бы его как есть. Кстати, в другой раз решение того же стоматолога может быть иным, иначе говоря, в разных случаях между его решениями нет абсолютной корреляции. В пятницу доктор Джонс, возможно, запломбировал бы этот зуб, а во вторник не стал бы его сверлить.Как же обстоит дело с подсчетом количества сперматозоидов? Надежность каждого конкретного метода анализа количества сперматозоидов невысока[116]
, как и надежность получения одинакового результата при разных способах измерения. При одновременном измерении количества сперматозоидов разными способами результаты могут быть совершенно разными[117].Валидность (пригодность, обоснованность) метода обычно также измеряется с помощью корреляций. Валидность способа измерения означает меру его соответствия цели измерения. Валидность IQ-тестов обычно существенна — около 0,5, — в такой степени баллы теста на уровень IQ соответствуют среднему баллу школьного аттестата. (На самом деле именно потребность в прогнозировании успеваемости учеников побудила французского психолога Альфреда Вине в начале XX в. разработать первый тест на уровень IQ.)
Пожалуйста, не забывайте о чрезвычайно важном принципе: без надежности не может быть валидности. Если оценки, которые дает человек, нестабильны (нулевая корреляция между оценкой значения переменной А в одном и другом случае), значит, они непригодны и не подходят для прогнозирования значений переменной величины Б.
Если результаты теста X и теста У, которые должны измерить значения переменной величины, совпадают только случайно, тогда в лучшем случае лишь один из этих тестов сколько-нибудь валиден. Напротив, надежность может быть очень высокой даже при отсутствии валидности. Графологи утверждают, что могут по почерку определить степень честности, трудолюбия, амбициозности, оптимизма и множество других качеств человека. Два графолога могут сойтись во мнении о качествах человека (высокая надежность), но не могут предсказать реальное поведение человека в связи с качествами его характера (нулевая валидность).