Читаем Код креативности. Как искусственный интеллект учится писать, рисовать и думать полностью

Одна из моих любимых игр на Atari называлась Breakout. Параллельно верхней кромке экрана шла стена из разноцветных кирпичиков, а игрок управлял расположенной внизу ракеткой, которую можно было двигать влево или вправо при помощи джойстика. Шарик отскакивал от ракетки и летел в сторону кирпичиков. Каждый раз, когда он попадал в какой-нибудь кирпичик, кирпичик исчезал. Целью игры было убрать с экрана все кирпичики. За попадание в один из желтых кирпичиков, из которых состояла нижняя часть стены, начислялось одно очко. Красные кирпичики в верхней части приносили по семь очков. По мере исчезновения кирпичиков ракетка становилась все меньше, а шарик летал все быстрее, что делало игру труднее.

Особенное удовольствие мы испытали однажды, когда придумали хитрый способ взломать эту игру. Нужно было пробить сквозь кирпичики на краю экрана туннель; тогда, если шарик пролетал сквозь него и оказывался сверху от стены, он начинал скакать, отражаясь от верхней кромки экрана и верхних, «дорогих», кирпичиков и постепенно уничтожая стену. Игрок мог расслабиться и просто смотреть за этим процессом, пока шарик в конце концов не прилетал сквозь стену обратно вниз. Нужно было только держать ракетку наготове, чтобы снова отбить шарик вверх. Очень приятная была стратегия!

Хассабис и другие члены группы, которую он собирал в это время, также много играли в молодости в компьютерные игры. Возможно, их родителям было приятно узнать, что время и силы, потраченные на эти игры, не были растрачены впустую. Игра Breakout оказалась идеальным полигоном для проверки способности коллектива DeepMind запрограммировать компьютер на обучение играм. Написать программу для каждой отдельной игры было бы работой сравнительно несложной. Но Хассабис и его коллеги ставили перед собой гораздо более трудную задачу.

Они хотели написать программу, которая получала бы на входе состояние пикселей экрана и текущий счет и играла так, чтобы максимизировать счет. Правила игры программе не сообщаются: она должна случайным образом экспериментировать, двигая в разные стороны ракетку в Breakout или по-всякому стреляя из лазерной пушки по снижающимся кораблям пришельцев в Space Invaders. Каждый раз, когда программа делает ход, она может оценить, привел ли он к увеличению счета или не произвел никакого эффекта.

Эта программа реализует возникшую еще в 1990-е годы концепцию обучения с подкреплением, которая предполагает корректировку вероятности определенных действий в зависимости от воздействия на функцию вознаграждения или счет. Например, в игре Breakout можно принять только одно-единственное решение – сдвинуть ракетку, расположенную внизу экрана, влево или вправо. Изначально выбор делается с вероятностью 50: 50. Но если случайное перемещение ракетки приводит к попаданию по шарику, то через короткое время после этого счет увеличивается. Тогда программа производит пере-калибровку вероятности смещения влево или вправо с учетом этой новой информации. Это увеличивает вероятность смещения в том же направлении, в котором движется шарик. Новшеством было совмещение такого обучения с нейронными сетями, которые должны были оценивать состояние пикселей и решать, какие именно элементы коррелируют с ростом счета.

Вначале, поскольку компьютер просто пробовал случайные ходы, его игра была ужасна; он почти не набирал очков. Но каждый раз, когда очередной случайный ход приводил к увеличению счета, программа запоминала этот ход и более активно использовала его в дальнейшем. Постепенно случайные ходы прекратились, и стал проявляться более обоснованный рисунок игры – ходы, которые, как программа выяснила на опыте, по-видимому, способствовали росту счета.

Видеоролик, который сотрудники DeepMind приложили в качестве иллюстрации к написанной впоследствии статье об этой работе, стоит посмотреть. В нем показано, как программа учится играть в Breakout. Сначала видно, как она случайным образом двигает ракетку взад и вперед, чтобы посмотреть, что из этого выйдет. Затем, когда шарик наконец попадает в ракетку, отскакивает от нее и разбивает кирпичик, отчего увеличивается счет, программа начинает переписывать самое себя. По-видимому, соприкосновение пикселей ракетки с пикселями шарика приносит положительный результат. После 400 партий программа играет уже по-настоящему сильно: ракетка постоянно отправляет шарик то туда, то сюда.

Но настоящий шок я испытал, когда увидел, что она открыла, сыграв 600 партий. Она нашла нашу лазейку! Не знаю точно, сколько партий потребовалось сыграть нам в детстве, чтобы освоить этот фокус, но, судя по количеству времени, которое потратили мы с другом, их вполне могло быть и больше. И вот тебе на. Манипулируя ракеткой, программа стала пробивать по бокам туннели, чтобы шарик застревал в пространстве между верхом стены и верхним краем экрана. После этого счет начинает расти очень быстро, а компьютеру почти ничего не приходится делать. Насколько я помню, когда мы с моим другом открыли этот трюк, мы запрыгали от восторга. Машина же не ощутила ничего.

Перейти на страницу:

Все книги серии Человек Мыслящий. Идеи, способные изменить мир

Мозг: Ваша личная история. Беспрецендентное путешествие, демонстрирующее, как жизнь формирует ваш мозг, а мозг формирует вашу жизнь
Мозг: Ваша личная история. Беспрецендентное путешествие, демонстрирующее, как жизнь формирует ваш мозг, а мозг формирует вашу жизнь

Мы считаем, что наш мир во многом логичен и предсказуем, а потому делаем прогнозы, высчитываем вероятность землетрясений, эпидемий, экономических кризисов, пытаемся угадать результаты торгов на бирже и спортивных матчей. В этом безбрежном океане данных важно уметь правильно распознать настоящий сигнал и не отвлекаться на бесполезный информационный шум.Дэвид Иглмен, известный американский нейробиолог, автор мировых бестселлеров, создатель и ведущий международного телесериала «Мозг», приглашает читателей в увлекательное путешествие к истокам их собственной личности, в глубины загадочного органа, в чьи тайны наука начала проникать совсем недавно. Кто мы? Как мы двигаемся? Как принимаем решения? Почему нам необходимы другие люди? А главное, что ждет нас в будущем? Какие открытия и возможности сулит человеку невероятно мощный мозг, которым наделила его эволюция? Не исключено, что уже в недалеком будущем пластичность мозга, на протяжении миллионов лет позволявшая людям адаптироваться к меняющимся условиям окружающего мира, поможет им освободиться от биологической основы и совершить самый большой скачок в истории человечества – переход к эре трансгуманизма.В формате pdf A4 сохранен издательский дизайн.

Дэвид Иглмен

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Голая обезьяна
Голая обезьяна

В авторский сборник одного из самых популярных и оригинальных современных ученых, знаменитого британского зоолога Десмонда Морриса, вошли главные труды, принесшие ему мировую известность: скандальная «Голая обезьяна» – ярчайший символ эпохи шестидесятых, оказавшая значительное влияние на формирование взглядов западного социума и выдержавшая более двадцати переизданий, ее общий тираж превысил 10 миллионов экземпляров. В доступной и увлекательной форме ее автор изложил оригинальную версию происхождения человека разумного, а также того, как древние звериные инстинкты, животное начало в каждом из нас определяют развитие современного человеческого общества; «Людской зверинец» – своего рода продолжение нашумевшего бестселлера, также имевшее огромный успех и переведенное на десятки языков, и «Основной инстинкт» – подробнейшее исследование и анализ всех видов человеческих прикосновений, от рукопожатий до сексуальных объятий.В свое время работы Морриса произвели настоящий фурор как в научных кругах, так и среди широкой общественности. До сих пор вокруг его книг не утихают споры.

Десмонд Моррис

Культурология / Биология, биофизика, биохимия / Биология / Психология / Образование и наука
Как построить космический корабль. О команде авантюристов, гонках на выживание и наступлении эры частного освоения космоса
Как построить космический корабль. О команде авантюристов, гонках на выживание и наступлении эры частного освоения космоса

«Эта книга о Питере Диамандисе, Берте Рутане, Поле Аллене и целой группе других ярких, нестандартно мыслящих технарей и сумасшедших мечтателей и захватывает, и вдохновляет. Слово "сумасшедший" я использую здесь в положительном смысле, более того – с восхищением. Это рассказ об одном из поворотных моментов истории, когда предпринимателям выпал шанс сделать то, что раньше было исключительной прерогативой государства. Не важно, сколько вам лет – 9 или 99, этот рассказ все равно поразит ваше воображение. Описываемая на этих страницах драматическая история продолжалась несколько лет. В ней принимали участие люди, которых невозможно забыть. Я был непосредственным свидетелем потрясающих событий, когда зашкаливают и эмоции, и уровень адреналина в крови. Их участники порой проявляли такое мужество, что у меня выступали слезы на глазах. Я горжусь тем, что мне довелось стать частью этой великой истории, которая радикально изменит правила игры».Ричард Брэнсон

Джулиан Гатри

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Муссон. Индийский океан и будущее американской политики
Муссон. Индийский океан и будущее американской политики

По мере укрепления и выхода США на мировую арену первоначальной проекцией их интересов были Европа и Восточная Азия. В течение ХХ века США вели войны, горячие и холодные, чтобы предотвратить попадание этих жизненно важных регионов под власть «враждебных сил». Со времени окончания холодной войны и с особой интенсивностью после событий 11 сентября внимание Америки сосредоточивается на Ближнем Востоке, Южной и Юго Восточной Азии, а также на западных тихоокеанских просторах.Перемещаясь по часовой стрелке от Омана в зоне Персидского залива, Роберт Каплан посещает Пакистан, Индию, Бангладеш, Шри-Ланку, Мьянму (ранее Бирму) и Индонезию. Свое путешествие он заканчивает на Занзибаре у берегов Восточной Африки. Описывая «новую Большую Игру», которая разворачивается в Индийском океане, Каплан отмечает, что основная ответственность за приведение этой игры в движение лежит на Китае.«Регион Индийского океана – не просто наводящая на раздумья географическая область. Это доминанта, поскольку именно там наиболее наглядно ислам сочетается с глобальной энергетической политикой, формируя многослойный и многополюсный мир, стоящий над газетными заголовками, посвященными Ирану и Афганистану, и делая очевидной важность военно-морского флота как такового. Это доминанта еще и потому, что только там возможно увидеть мир, каков он есть, в его новейших и одновременно очень традиционных рамках, вполне себе гармоничный мир, не имеющий надобности в слабенькой успокоительной пилюле, именуемой "глобализацией"».Роберт Каплан

Роберт Дэвид Каплан

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература

Похожие книги

Комично, как все химично! Почему не стоит бояться фтора в зубной пасте, тефлона на сковороде, и думать о том, что телефон на зарядке взорвется
Комично, как все химично! Почему не стоит бояться фтора в зубной пасте, тефлона на сковороде, и думать о том, что телефон на зарядке взорвется

Если бы можно было рассмотреть окружающий мир при огромном увеличении, то мы бы увидели, что он состоит из множества молекул, которые постоянно чем-то заняты. А еще узнали бы, как действует на наш организм выпитая утром чашечка кофе («привет, кофеин»), более тщательно бы выбирали зубную пасту («так все-таки с фтором или без?») и наконец-то поняли, почему шоколадный фондан получается таким вкусным («так вот в чем секрет!»). Химия присутствует повсюду, она часть повседневной жизни каждого, так почему бы не познакомиться с этой наукой чуточку ближе? Автор книги, по совместительству ученый-химик и автор уникального YouTube-канала The Secret Life of Scientists, предлагает вам взглянуть на обычные и привычные вещи с научной точки зрения и даже попробовать себя в роли экспериментатора!В формате PDF A4 сохранен издательский макет.

Нгуэн-Ким Май Тхи

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Научно-популярная литература / Образование и наука
История Византии
История Византии

Византийская империя. «Второй Рим».Великое государство, колыбель православия, очаг высокой культуры?Тирания, безжалостно управлявшая множеством покоренных народов, давившая в подданных всякий намек на свободомыслие и жажду независимости?Путешественники с восхищением писали о блеске и роскоши «Второго Рима» и с ужасом упоминали о жестокости интриг императорского двора, о многочисленных религиозных и политических распрях, терзавших империю, о феноменально скандальных для Средневековья нравах знатных византийцев…Византийская империя познала и времена богатства и могущества, и дни упадка и разрушения.День, когда Византия перестала существовать, известен точно: 29 мая 1453 года.Так ли это? Что стало причиной падения Византийской империи?Об этом рассказывает в своей уникальной книге сэр Джон Джулиус Норвич.

Джон Джулиус Норвич

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература