Второй подход построения тестов состоит в создании теории интеллекта, на основе которой затем вырабатываются тесты. Преимущество такого подхода, очевидно, в том, что вы вооружены четким определением понятия интеллекта. Потребители тестов – психологи, школы или служащие, которые приобретают этот товар, – могут решать, нравится им данная теория или нет, и на основе этого решения покупать или не покупать тесты. Во многих отношениях такой подход к тестированию является более честным. Издатели тестов говорят, что они понимают под интеллектом, а потребители могут принять эту точку зрения или отвергнуть ее. Здесь нет лукавства с ярлыками: вам открыто говорят, что продают.
Но лишь очень немногие тесты проверки умственных способностей создаются на основе теорий интеллекта. Почему? Потому, что такой подход вынуждает издателей тестов принимать определенную концепцию интеллекта. А они, как правило, избегают этого: либо потому, что сами имеют весьма смутное представление об этом, либо для того, чтобы побольше продать своей продукции. Они рассуждают подобно производителям пищевых продуктов до принятия законов о точности содержания ярлыков и наклеек: чем меньше люди знают о том, что им предлагают, тем меньше вероятность, что они от этого откажутся. Сегодня, если вам не нравятся продукты с высоким содержанием жира, вы просто их не покупаете. Раньше, не зная содержания жира в конкретном продукте, вы вполне могли бы и купить его, повышая таким образом общий объем его продаж. Что касается тестов, то ввиду отсутствия четких теоретических основ вы часто покупаете то, о чем имеете достаточно смутное представление.
Как оцениваются тесты проверки умственных способностей
Безусловно, потребители тестов не являются полными идиотами и хотят получить адекватную информацию об этом товаре – их приходится убеждать, что тесты небесполезны хотя бы в некоторых процессах принятия решений (или, по крайней мере, производят такое впечатление).
Валидность
Первую важную информацию такого рода, которая будет постоянно обсуждаться в данной книге, часто называют «критерием валидности». Вопрос здесь состоит в том, насколько результаты тестирования измеряют то, что они должны измерять в соответствии со своим назначением. Отражают ли они то, что от них действительно ожидают? Например, критерием валидности тестов проверки умственных способностей часто служат оценки, которые ученики получают в школе; а если речь идет о программах профессиональной подготовки, критерием может быть последующая эффективность на рабочих местах.
В так называемых технических руководствах по использованию тестов приводится масса статистических материалов, связанных с критериями валидности тестов. Но здесь, опять-таки, не все так просто. В какой степени нас должны беспокоить оценки в школе? Разве они служат показателем того, что один человек умнее другого? Или должны ли нас волновать показатели стандартизованных тестов достижений? Мой сын начал выпускать свою газету в школе, он постоянно готовит материалы в уже существующую школьную газету, пилотирует самолет, переводит в местной больнице на английский язык жалобы и другие медицинские проблемы испаноязычных пациентов. По-моему, неплохие достижения для семнадцатилетнего парня. Однако ни одно из них не относится к тем критериям, по которым проверяется валидность тестов проверки интеллектуальности. А разве взрослых людей волнуют полученные когда-то оценки? Может быть, кандидатов на ответственные посты в промышленности отбирают на основе этих оценок? Сомневаюсь!
С моей точки зрения, очень печально, что мы относимся к результатам тестирования способностей как к официальным, важным данным, а к внеклассной деятельности детей – как к чему-то второстепенному. И поскольку часто бывает удобно прикрываться количественными результатами, мы предпочитаем просто считать, а не серьезно анализировать такую деятельность. В результате ученик, посещающий три внешкольных клуба, оценивается выше того, кто придумал и организовал один клуб. Наилучшим предсказателем интеллекта успеха в будущем является интеллект успеха в прошлом. И предсказания должны базироваться на успешной деятельности в реальном мире в течение длительного периода времени, а не на успехах в мире тестирования, длительность существования которого составляет всего три часа.