Андреас признает, что с помощью тестов множественного выбора можно оценить далеко не все и что одна из главных задач американского образования – загнать тестирование в нужные рамки. «Мы стараемся реже проводить тесты и формировать небольшие группы учащихся и, следовательно, инвестируем в качество оценивания. При разумном числе учеников мы можем себе позволить включить в тест более сложные задачи, а также инструменты, разработанные компьютером и с его помощью функционирующие.
Мы всегда должны соблюдать баланс между тем, что важно и что целесообразно оценивать. В 2000 году оценивалось чтение, математика и естественно-научные дисциплины. В 2003-м мы начали добавлять социальные и эмоциональные компоненты. В 2012-м ввели очень интересную оценку навыков в области творческого решения проблем. Нас часто спрашивают, почему мы не сделали этого сразу, но в то время у нас не было компьютерных оценочных систем, которые мы сейчас имеем.
Очень трудно оценивать творческие навыки, если вы даете ученику задачу, уже сформулированную на бумаге, и просите написать ответ опять же на бумаге. Навыки творческого решения проблем непосредственно связаны с тем, как человек взаимодействует с проблемой и как меняется его подход к ней по мере того, как меняется сама проблема в процессе его взаимодействия с ней. И оценить это можно только с помощью смоделированной на компьютере среды».
Андреас твердо намерен и впредь работать в этом направлении, но признает, что по ходу дела возникает немалое количество «серых зон». «Задачи, требующие развернутого ответа, оценивать намного сложнее. Учащиеся должны будут решать на экзамене большее число таких задач, соответственно, потребуются оценщики-люди (а не компьютеры), причем несколько. Возникают вопросы и в связи с надежностью оценивания. Многим все это не очень нравится, потому что данный подход обходится гораздо дороже и его результаты весьма спорные, однако в итоге вы получаете куда более достоверную информацию. Количество способов, которыми люди решают задачи, требующие развернутого ответа, намного разнообразнее, нежели те, на которые достаточно дать однозначный ответ».
Как это часто бывает, трудности в этом случае связаны не со сбором данных, а с тем, как эти данные используются. В мае 2014 года большая группа ученых со всего мира опубликовала открытое письмо Андреасу Шляйхеру. В нем среди прочего содержалась просьба о том, чтобы PISA рассмотрела вопрос об альтернативе своему рейтингу, а также о возможности нарушения цикла тестирования, что дало бы школьным системам время проанализировать и впитать то, что они уже узнали.
«Результатов тестов PISA с огромным нетерпением ждут государственные органы, министры образования и редакции газет; их авторитетно цитируют в бесчисленных отчетах, – говорилось в письме. – Они стали чрезвычайно мощно влиять на образовательную практику многих стран мира. Из-за тестирования PISA некоторые страны радикально меняют свои системы образования в надежде на рост рейтинга. Отсутствие какого-либо прогресса в рейтингах PISA в ряде стран привело сегодня к заявлениям о кризисе и так называемом шоке PISA, за которыми последовали призывы к отставкам и масштабным реформам в соответствии с инструкциями PISA»[149]
.Наибольшее же беспокойство авторов письма вызывал тот факт, что результаты PISA, как правило, ведут к увеличению масштабов стандартизированного тестирования в разных странах мира и краткосрочным мерам, нацеленным на улучшение положения страны в рейтинге, а вовсе не на то, чтобы реально улучшить условия для учащихся.
И я, и многие другие критики итогового тестирования выступаем вовсе не против оценивания знаний учащихся, являющегося неотъемлемой составляющей образования, а против формы, которую оно сегодня приняло, и вреда, который приносит нашим детям. Так в чем же суть оценивания и для чего оно нужно?
Потребность в оценивании (и тестировании)
Оценивание представляет собой процесс принятия решений о прогрессе и достижениях учащихся. Как я утверждаю в своей книге «Образование против таланта», оценивание включает в себя два компонента: описание и оценку. Когда вы говорите, что кто-то может пробежать милю за четыре минуты или знает французский язык, это нейтральные описания способностей этого человека. Если же вы говорите, что кто-то лучший легкоатлет в округе или знает французский язык как родной, это уже оценка. Разница в том, что оценка сопоставляет достижения человека с показателями других людей и ранжирует их с использованием определенных критериев.
Оценивание играет сразу несколько ролей. Первая –