Читаем Models of the Mind полностью

Рекурсия - распространенный прием в математике и информатике отчасти потому, что рекурсивные определения гибкие: их можно сделать длинными или короткими, как это необходимо. Например, формулу для расчета общего вознаграждения по плану можно с одинаковым успехом применить как к плану из пяти шагов, так и к плану из 500 шагов. Рекурсия - это еще и концептуально простой способ добиться чего-то потенциально сложного. Подобно поворотам винтовой лестницы, каждый шаг в рекурсивном определении знаком, но не идентичен, и нам нужно только следовать по ним один за другим до конца.

В формулировке Беллмана есть еще две идеи, которые помогли сделать его стратегию эффективной для применения в реальных проблемах. Первая заключается в том, что он включил в свою стратегию тот весьма убедительный факт, что вознаграждение, которое вы получаете немедленно, стоит больше, чем вознаграждение, которое вы получаете позже. Для этого он ввел в рекурсивное определение коэффициент дисконтирования. Таким образом, если в первоначальной формуле вознаграждение от пятишагового плана было равно вознаграждению от первого шага плюс полное вознаграждение от четырехшагового плана, то в уравнении с дисконтированием оно будет равно вознаграждению от первого шага плюс, возможно, 80 процентов от вознаграждения от четырехшагового плана. Дисконтирование - это способ соизмерять немедленное удовлетворение с отложенным; это "птица в руке стоит двух в кустах", кодифицированное в математике.

Второе понимание было более концептуальным и более радикальным. Это был переход от фокусировки на вознаграждениях к фокусировке на ценностях.

Чтобы понять эту подмену, давайте рассмотрим владельца малого бизнеса - очень малого бизнеса. Анжела - бродяга в нью-йоркском метро. Она знает, что может играть на своей электрической скрипке в течение 20 минут на определенных станциях метро, прежде чем ее прогонят власти, и тогда ей не разрешат вернуться. На разных станциях, однако, выплачиваются разные суммы. Туристические районы могут быть очень прибыльными, в то время как остановки для коренных ньюйоркцев приносят гораздо меньше пожертвований. Она выходит из своего дома на Гринпойнт-авеню в Бруклине и хочет оказаться рядом с домом подруги на Бликер-стрит. Какой путь ей выбрать, чтобы заработать больше всего денег по дороге к месту назначения?

До сих пор мы замечали, что, начав с одной позиции и сделав шаг по плану, мы оказываемся в обстоятельствах, в целом схожих с теми, с которых начинали, - только начинаем мы с другой позиции и имеем другой план. В последовательном принятии решений различные позиции, через которые мы можем пройти, называются состояниями, а шаги в плане часто называют действиями. В случае с Анжелой состояния - это различные станции метро , на которых она может оказаться. Каждый раз, когда Анжела совершает действие (например, переходит со станции А на станцию Б), она оказывается в новом состоянии (станция Б), которое одновременно приносит ей определенное вознаграждение (количество пожертвований, которые получает ее игра) и предоставляет ей новый набор возможных действий (другие станции, на которые можно перейти). Таким образом, состояния определяют, какие действия доступны (например, вы не можете сразу отправиться с Гринпойнт-авеню на Таймс-сквер), а действия определяют, какими будут следующие состояния.

Это взаимодействие - когда действия, предпринятые в рамках плана, влияют на то, какие действия будут доступны в будущем, - является частью того, что делает последовательные процессы принятия решений такими сложными. Что сделал Беллман, так это взял это созвездие состояний, действий и вознаграждений и перевернул его с ног на голову. Вместо того чтобы говорить о вознаграждении, ожидаемом от серии действий, он сосредоточился на ценности, которую имеет любое данное состояние.

Ценность, в разговорном смысле, - понятие туманное. Оно вызывает мысли о деньгах и стоимости, а также о более глубоких понятиях смысла и пользы, которые бывает трудно определить. Уравнение Беллмана, однако, дает точное определение ценности. Используя ту же рекурсивную структуру, которая была представлена ранее, Беллман определил ценность состояния как вознаграждение, которое вы получаете в этом состоянии, плюс дисконтированная стоимость следующего состояния. Заметьте, в этом определении нет явного понятия плана; ценность определяется другими ценностями.

Тем не менее, это уравнение опирается на знание следующего состояния. Без плана, в котором указано, какое действие будет предпринято, как мы узнаем, каким будет следующее состояние? Именно здесь в игру вступает первоначальная интуиция - идея о том, что лучший план складывается из лучших действий. Чтобы рассчитать стоимость в следующем состоянии, достаточно предположить, что будет предпринято наилучшее возможное действие. А наилучшее возможное действие - это то, которое ведет к состоянию с наибольшей ценностью! Если говорить языком ценности, то сам план исчезает.

Перейти на страницу:

Похожие книги

Мозг и разум в эпоху виртуальной реальности
Мозг и разум в эпоху виртуальной реальности

Со Ёсон – южнокорейский ученый, доктор наук, специалист в области изучения немецкого языка и литературы, главный редактор издательства Корейского общества Бертольда Брехта, исследующий связи различных дисциплин от театрального искусства до нейробиологии.Легко ли поверить, что Аристотель и научно-фантастический фильм «Матрица» проходят красной нитью через современную науку о мозге и философию Спинозы, объясняя взаимоотношения мозга и разума?Как же связаны между собой головной мозг, который называют колыбелью сознания, и разум, на который как раз и направлена деятельность сознания?Можно ли феномен разума, который считается решающим фактором человеческого развития, отличает людей от животных, объяснить только электрохимической активностью нейронов в головном мозге?Эта книга посвящена рассмотрению подобных фундаментальных вопросов и объединяет несколько научных дисциплин, которые развились в ходе напряженных споров о соотношении материи и разума, которые берут своё начало с древних времен и продолжаются по сей день. Данная работа не является простым цитированием ранее написанных исследований, направленным на защиту своей позиции, она подчеркивает необходимость появления нового исследования мозга, которое должно будет вобрать в себя как философские умозаключения, так и научную доказательную базу.В формате PDF A4 сохранен издательский макет.

Со Ёсон

Биология, биофизика, биохимия
Расширенный фенотип
Расширенный фенотип

«Расширенный фенотип» – одна из лучших книг известного учёного и видного популяризатора науки Ричарда Докинза. Сам автор так сказал про неё в предисловии ко второму изданию: «Думаю, что у большинства учёных – большинства авторов – есть какая-то одна публикация, про которую они говорили бы так: не страшно, если вы никогда не читали моих трудов кроме "этого", но "этот" пожалуйста прочтите. Для меня таким трудом является "Расширенный фенотип"». Помимо изложения интересной научной доктрины, а также весьма широкого обзора трудов других исследователей-эволюционистов, книга важна своей глубоко материалистической философской и мировоззренческой позицией, справедливо отмеченной и высоко оцененной в послесловии профессионального философа Даниэла Деннета.

Ричард Докинз

Биология, биофизика, биохимия