Если мы полагаем, что в названии этого учебного процесса слово "ошибка" означает то же, что мы имели в виду, когда говорили, что "игрок" не способен на ошибку, тогда "пробы и ошибки" исключаются из репертуара "игрока" фон Неймана. Фактически "игрок" фон Неймана заставляет нас очень тщательно исследовать то, что мы имеем в виду под "обучением методом проб и ошибок", а также, разумеется, всего, что имеется в виду под обучением любого рода. Предположение, связанное со значением слова "ошибка", нетривиально и должно быть исследовано.
В определенном смысле "игрок" может ошибаться. Например, он может принять решение по вероятностным соображениям и затем сделать ход, который в свете ограниченной доступной информации является правильным с наибольшей вероятностью. Когда же становится доступно больше информации, он может обнаружить, что ход был ошибочным. Но это открытие ничего не может прибавить к его будущим навыкам. По определению, игрок правильно использовал всю доступную информацию. Он правильно оценил вероятности и сделал ход, который был правильным с наибольшей вероятностью. Открытие того, что в некоторый момент он ошибся, не может иметь отношения к будущим ситуациям. Если впоследствии возникнет та же проблема, он проделает те же вычисления, придет к тем же решениям и будет прав. Более того, набор альтернатив, из которого он будет делать свой выбор, будет все тем же набором. И это правильно.
По контрасту, организм способен ошибаться многими "способами", на которые "игрок" не способен. Эти неправильные выборы уместно назвать "ошибками" в том случае, когда они имеют такой характер, что дают организму информацию, способную увеличивать его будущие навыки. Во всех этих случаях некоторая доступная информация либо игнорируется, либо используется некорректно. Можно классифицировать различные виды таких полезных ошибок.
Предположим, что внешнее событие содержит детали, которые могут сообщить организму:
a) из какого набора альтернатив он должен выбрать свой следующий ход;
b) какой элемент этого набора он должен выбрать. Такая ситуация допускает двоякого рода ошибки:
(1) организм может правильно использовать информацию, которая говорит, из какого набора альтернатив он должен выбрать, но выбрать неправильную альтернативу внутри этого набора;
(2) он может выбрать из неправильного набора альтернатив.
(Имеется также интересный класс случаев, в которых наборы альтернатив содержат общие элементы. Поэтому для организма есть возможность быть "правым", но по ошибочным причинам. Эта форма ошибки неизбежно является самоусиливающейся.)
Если теперь принять общее положение, что любое обучение, отличное от нулевого обучения, в некоторой степени сто-хастично (т.е. содержит компоненты "проб и ошибок"), то из этого следует, что упорядочение процесса обучения может быть построено на иерархической классификации типов ошибок, которые должны быть исправлены в различных учебных процессах. Нулевое обучение станет тогда обозначением для непосредственной основы всех тех актов (простых и сложных), которые не корректируются методом проб и ошибок; обучение-I будет уместным обозначением для пересмотра выбора внутри неизменного набора альтернатив; обучение-II будет обозначать пересмотр набора, из которого делается выбор, и т.д.
Обучение-I
Следуя формальной аналогии, задаваемой "законами" движения (т.е. "правилами" описания движений), мы попытаемся найти класс явлений, описание которого соответствует изменениям при нулевом обучении (так "движение" описывает изменение положения). Это случаи, при которых объект во время t=2 дает другой отклик, нежели во время t=1. Тут мы снова сталкиваемся со множеством случаев, различно связанных с опытом, физиологией, генетикой и механическими процессами.
(a) Существует феномен привыкания, т.е. замены ответа на каждое появление повторяющегося события на отсутствие Явного ответа. Существует также угасание (или потеря) привыкания, которое может произойти в результате более или менее длительного перерыва в последовательности повторений события-стимула. (Привыкание представляет особый интерес. Специфичность отклика, которую мы называем нулевым обучением, характерна для любой протоплазмы, однако интересно отметить, что "привыкание" -это, возможно, единственная форма обучения-I, которую живые существа могут достигать без обладания нервной цепью.)
(b) Самый знакомый и, возможно, самый изученный случай - это классическое павловское обусловливание. При t=2 собака выделяет слюну в ответ на звонок; она не делает этого при t=1.
(c) Существует "обучение", возникающее в контексте инструментального поощрения и инструментального избегания.
(d) Существует феномен обучения путем многократного повторения (rote learning), в котором одна единица поведения организма становится стимулом для другой единицы поведения.
(e) Существует обрыв (угасание или подавление) "завершенного" обучения, который может последовать за изменением или отсутствием подкрепления.