Читаем На краю пропасти. Экзистенциальный риск и будущее человечества полностью

Итак, в ближайшем будущем любая попытка откалибровать ИИ-агент в соответствии с человеческими ценностями позволит нам создать лишь несовершенную копию нашего разума. В функции вознаграждения такого агента будет недоставать важных аспектов того, что нас заботит. При определенных обстоятельствах не совсем верная калибровка агента будет практически безвредной. Но чем умнее ИИ-системы, тем больше у них возможностей менять мир и тем сильнее рассинхронизация. Философия и литература часто предлагают представить себе общества, которые выстроены с учетом важных для нас принципов, но при этом пренебрегают крайне значимыми ценностями или неправильно понимают их. Глядя на результат, мы видим, что подобные неконтролируемые утопии могут привести к катастрофе: пустоте и выхолощенности, как в романе “О дивный новый мир”, или несамостоятельности и бессилию общества из “Со сложенными руками”[414]. Если мы так и не научимся контролировать своих агентов, они будут создавать и поддерживать именно такие миры[415].

И даже это, по сути, хороший расклад. Он предполагает, что создатели системы стараются откалибровать ее с учетом человеческих ценностей. Но стоит ожидать, что найдутся разработчики, которые предпочтут создавать системы, чтобы достигать других целей, например чтобы побеждать в войнах и максимизировать прибыли, при этом мало заботясь об этических ограничениях. И такие системы, возможно, окажутся гораздо более опасными.

Естественным ответом на эти опасения может служить отключение ИИ-систем в момент, когда мы замечаем, что они ведут нас не туда. Но в конце концов даже этот проверенный временем прием может нас подвести, ведь у нас есть все основания полагать, что достаточно умная система станет сопротивляться нашим попыткам ее отключить. И руководствоваться она будет не эмоциональными реакциями вроде страха, негодования и инстинкта самосохранения, а исключительно своей непререкаемой установкой максимизировать вознаграждение: отключение – это своего рода выход из строя, который осложняет получение большого вознаграждения, а потому система настроена так, чтобы его не допускать[416]. Таким образом, для высокоинтеллектуальных систем, главная цель которых – максимизация вознаграждения, инструментальной целью станет выживание.

У них появятся и другие инструментальные цели[417]. Интеллектуальный агент будет также сопротивляться попыткам изменить его функцию вознаграждения, откалибровав ее в соответствии с человеческими ценностями, поскольку сможет спрогнозировать, что в результате это приведет к уменьшению ожидаемого вознаграждения[418]. Агент будет стремиться к получению дополнительных ресурсов – вычислительных, физических, человеческих, – которые позволят ему эффективнее менять среду, чтобы получать более крупное вознаграждение. В конце концов у него появится и стимул забрать у человечества контроль над будущим, поскольку это поможет ему в достижении всех перечисленных инструментальных целей: он получит доступ к огромным ресурсам, не допустив ни отключения, ни изменения своей функции вознаграждения. Поскольку люди предсказуемо захотят скорректировать инструментальные цели агента, это будет мотивировать его к тому, чтобы скрывать эти цели, пока не станет слишком поздно оказывать ему значимое сопротивление[419].

Скептики порой отмечают, что описанное выше возможно лишь в том случае, если будет создана ИИ-система, которая окажется достаточно умна, чтобы захватить контроль над миром, но слишком глупа, чтобы понять, что мы этого не хотим[420]. Но это неверная трактовка сценария. На самом деле при таком раскладе система прекрасно понимает, что ее цели не совпадают с нашими, и именно это подталкивает ее к обману, конфликту и захвату власти. Истинная проблема в том, что исследователи ИИ пока не знают, как создать систему, которая, заметив это несоответствие, обновляет свою систему ценностей, приближая ее к нашей, а не корректирует свои инструментальные цели, чтобы одержать над нами верх[421].

Возможно, найдется способ решить перечисленные проблемы, или найти новые подходы к контролю над ИИ, чтобы снять сразу много вопросов, или переключиться на новые парадигмы создания ОИИ, в рамках которых этих проблем не возникает. Я, безусловно, надеюсь на это и внимательно слежу за прогрессом в этой сфере. Но прогресс пока невелик, и остается немало серьезных нерешенных проблем. При сохранении текущей парадигмы достаточно интеллектуальные агенты в итоге приобретут инструментальные цели, чтобы обмануть и пересилить нас. И если их интеллект будет в значительной степени превосходить наш собственный, не стоит ожидать, что человечество сумеет победить в этой борьбе и сохранить контроль над своим будущим.


Перейти на страницу:

Похожие книги

Агнец Божий
Агнец Божий

Личность Иисуса Христа на протяжении многих веков привлекала к себе внимание не только обычных людей, к ней обращались писатели, художники, поэты, философы, историки едва ли не всех стран и народов. Поэтому вполне понятно, что и литовский религиозный философ Антанас Мацейна (1908-1987) не мог обойти вниманием Того, Который, по словам самого философа, стоял в центре всей его жизни.Предлагаемая книга Мацейны «Агнец Божий» (1966) посвящена христологии Восточной Церкви. И как представляется, уже само это обращение католического философа именно к христологии Восточной Церкви, должно вызвать интерес у пытливого читателя.«Агнец Божий» – третья книга теологической трилогии А. Мацейны. Впервые она была опубликована в 1966 году в Америке (Putnam). Первая книга трилогии – «Гимн солнца» (1954) посвящена жизни св. Франциска, вторая – «Великая Помощница» (1958) – жизни Богородицы – Пречистой Деве Марии.

Антанас Мацейна

Философия / Образование и наука
Афоризмы житейской мудрости
Афоризмы житейской мудрости

Немецкий философ Артур Шопенгауэр – мизантроп, один из самых известных мыслителей иррационализма; денди, увлекался мистикой, идеями Востока, философией своего соотечественника и предшественника Иммануила Канта; восхищался древними стоиками и критиковал всех своих современников; называл существующий мир «наихудшим из возможных миров», за что получил прозвище «философа пессимизма».«Понятие житейской мудрости означает здесь искусство провести свою жизнь возможно приятнее и счастливее: это будет, следовательно, наставление в счастливом существовании. Возникает вопрос, соответствует ли человеческая жизнь понятию о таком существовании; моя философия, как известно, отвечает на этот вопрос отрицательно, следовательно, приводимые здесь рассуждения основаны до известной степени на компромиссе. Я могу припомнить только одно сочинение, написанное с подобной же целью, как предлагаемые афоризмы, а именно поучительную книгу Кардано «О пользе, какую можно извлечь из несчастий». Впрочем, мудрецы всех времен постоянно говорили одно и то же, а глупцы, всегда составлявшие большинство, постоянно одно и то же делали – как раз противоположное; так будет продолжаться и впредь…»(А. Шопенгауэр)

Артур Шопенгауэр

Философия