Читаем Власть роботов. Как подготовиться к неизбежному полностью

Подавляющее большинство систем глубокого обучения натаскивают на решение полезных задач путем представления обширного набора данных, тщательно размеченных или классифицированных. Например, глубокую нейронную сеть можно научить правильно идентифицировать животных на фотографиях, если продемонстрировать ей тысячи или даже миллионы изображений, на каждом из которых имеется правильное название животного. Такая процедура, так называемое контролируемое обучение, может занимать многие часы даже при использовании очень производительного оборудования.

Подобный подход используется, пожалуй, в 95 % случаев практического машинного обучения. На его основе работают ИИ-системы расшифровки рентгеновских снимков (обученные на гигантском количестве медицинских снимков, разбитых на категории «рак» и «не рак»), языкового перевода (обученные на миллионах документов, заранее переведенных на разные языки) и почти бесконечное множество других приложений, осуществляющих, по существу, сравнение и классификацию разных форм информации. Контролируемое обучение обычно требует огромного количества размеченных данных, но результаты бывают очень впечатляющими — системы обретают сверхчеловеческую способность распознавать образы. Через пять лет после состязания ImageNet 2012 года алгоритмы распознавания образов стали насколько эффективными, что конкурс был переориентирован на задачу распознавания трехмерных объектов из реального мира[141].

В случаях, когда для разметки всех данных требуется интерпретация, на которую способен только человек, как, например, при присоединении описаний к фотографиям, процесс становится дорогостоящим и громоздким. Одним из решений является подход, использованный Фей-Фей Ли для комплекса данных ImageNet, — обращение к краудсорсингу. Такие платформы, как Mechanical Turk, позволяют платить распределенной команде людей гроши за выполнение подобной работы. Стремление упростить этот процесс привело к появлению ряда стартапов, занимающихся поиском эффективных способов разметки данных при подготовке к контролируемому обучению. Точная разметка данных из огромных баз имеет принципиальное значение, особенно для случаев распознавания визуальной информации. Об этом убедительно свидетельствует стремительный взлет компании Scale AI, которую основал в 2016 году отчисленный из МТИ 19-летний Александр Ван. Scale AI заключает краудсорсинговые договоры с более чем 30 000 исполнителей, которые размечают данные для ее клиентов, включая Uber, Airbnb и Waymo, отделение беспилотных автомобилей холдинга Alphabet. Компания привлекла более $100 млн венчурных инвестиций и теперь считается «единорогом» Кремниевой долины — стартапом стоимостью более $1 млрд[142].

Однако нередко почти непостижимые по объему массивы прекрасно размеченных данных появляются чуть ли не сами собой и практически бесплатно для поддерживающих их компаний. Массированные потоки данных, генерируемых такими платформами, как Facebook, Google или Twitter, ценны в значительной степени потому, что они тщательно размечены пользователями. Ставя «лайк» или делая «ретвит», просматривая веб-страницу или видео, а если брать в целом — совершая любое действие в сети, вы фактически маркируете конкретное изображение или фрагмент данных. Вместе с миллионами других пользователей одной из крупнейших платформ вы, по сути, заменяете работников, привлеченных на основе краудсорсинга такими компаниями, как Scale AI. Неслучайно самые масштабные программы изучения ИИ связаны с крупными интернет-компаниями. Синергия искусственного интеллекта и гигантских массивов данных отмечается часто, но важнейшим фактором, лежащим в основе этого симбиоза, является наличие механизма дешевой или бесплатной разметки всех этих данных, которые затем можно «скормить» мощной нейросети в режиме контролируемого обучения.

Несмотря на господство контролируемого обучения, в некоторых случаях используется другой метод — «обучение с подкреплением». Он создает компетенцию посредством многократно повторяющейся практики или путем проб и ошибок. Когда наконец алгоритм решает поставленную задачу, он получает цифровое поощрение. В сущности, так дрессируют собак. Сначала поведение животного может быть случайным, но когда оно садится в ответ на соответствующую команду, то получает вознаграждение. Повторяйте этот процесс достаточно долго, и собака научится безошибочно садиться по команде.

Перейти на страницу:

Похожие книги

100 великих угроз цивилизации
100 великих угроз цивилизации

Человечество вступило в третье тысячелетие. Что приготовил нам XXI век? С момента возникновения человечество волнуют проблемы безопасности. В процессе развития цивилизации люди смогли ответить на многие опасности природной стихии и общественного развития изменением образа жизни и новыми технологиями. Но сегодня, в начале нового тысячелетия, на очередном высоком витке спирали развития нельзя утверждать, что полностью исчезли старые традиционные виды вызовов и угроз. Более того, возникли новые опасности, которые многократно усилили риски возникновения аварий, катастроф и стихийных бедствий настолько, что проблемы обеспечения безопасности стали на ближайшее будущее приоритетными.О ста наиболее значительных вызовах и угрозах нашей цивилизации рассказывает очередная книга серии.

Анатолий Сергеевич Бернацкий

Публицистика
1941 год. Удар по Украине
1941 год. Удар по Украине

В ходе подготовки к военному противостоянию с гитлеровской Германией советское руководство строило планы обороны исходя из того, что приоритетной целью для врага будет Украина. Непосредственно перед началом боевых действий были предприняты беспрецедентные усилия по повышению уровня боеспособности воинских частей, стоявших на рубежах нашей страны, а также созданы мощные оборонительные сооружения. Тем не менее из-за ряда причин все эти меры должного эффекта не возымели.В чем причина неудач РККА на начальном этапе войны на Украине? Как вермахту удалось добиться столь быстрого и полного успеха на неглавном направлении удара? Были ли сделаны выводы из случившегося? На эти и другие вопросы читатель сможет найти ответ в книге В.А. Рунова «1941 год. Удар по Украине».Книга издается в авторской редакции.В формате PDF A4 сохранен издательский макет книги.

Валентин Александрович Рунов

Военное дело / Публицистика / Документальное
Принцип Дерипаски
Принцип Дерипаски

Перед вами первая системная попытка осмыслить опыт самого масштабного предпринимателя России и на сегодняшний день одного из богатейших людей мира, нашего соотечественника Олега Владимировича Дерипаски. В книге подробно рассмотрены его основные проекты, а также публичная деятельность и антикризисные программы.Дерипаска и экономика страны на данный момент неотделимы друг от друга: в России около десятка моногородов, тотально зависимых от предприятий олигарха, в более чем сорока регионах работают сотни предприятий и компаний, имеющих отношение к двум его системообразующим структурам – «Базовому элементу» и «Русалу». Это уникальный пример роли личности в экономической судьбе страны: такой социальной нагрузки не несет ни один другой бизнесмен в России, да и во всем мире людей с подобным уровнем личного влияния на национальную экономику – единицы. Кто этот человек, от которого зависит благополучие миллионов? РАЗРУШИТЕЛЬ или СОЗИДАТЕЛЬ? Ответ – в книге.Для широкого круга читателей.

Владислав Юрьевич Дорофеев , Татьяна Петровна Костылева

Публицистика / Документальное / Биографии и Мемуары