На дорогах ничего не стоит испугаться[138]
. Машины неожиданно выезжают с трассы или тормозят, когда водителю померещится препятствие. Слабонервные люди могут отказаться от беспилотной функции и тем самым не дадут Tesla учиться. Даже если компании удастся привлечь кого-либо к бета-тестированию, правильно ли она выберет кандидатов? Ведь кто-то из них может оказаться более склонным к риску, чем среднестатистический водитель. И какой он подаст пример машине?Чем больше данных, тем быстрее учатся машины, а где их брать, как не в реальном мире? Однако не исключены проблемы, которые могут повредить имиджу компании. Ранний выпуск продукта способствует обучению, но создает риск потери репутации (также могут пострадать клиенты). Поздний выпуск замедляет обучение, зато дает больше времени на улучшение продукта и не повредит репутации (и клиенты будут целее).
Для таких продуктов, как Google Inbox, компромиссное решение очевидно, поскольку издержки от низкой эффективности малы, а плюсы от обучения в процессе использования существенны. Такие продукты есть смысл выпускать пораньше. В других случаях, например с автомобилями, все не так просто. Чем больше компаний во всех отраслях будут пользоваться преимуществами машинного обучения, тем понятнее станут стратегии принятия компромиссных решений.
Обучение на симуляторах
Использование моделируемой среды для обучения упрощает поиск компромиссного решения. Пилоты сотни часов проводят за сложными реалистичными симуляторами, прежде чем им доверят управлять настоящим самолетом. Такой же подход применим к ИИ. Google учила ИИ AlphaGo компании DeepMind побеждать лучших мировых игроков в го, не только показывая ему тысячи поединков между людьми, но в игре с другой версией себя.
Одна из форм этого метода называется
В реальных условиях такое обучение невозможно. Оно проводится в лаборатории, где создается новый алгоритм машинного обучения, который затем копируется и отправляется пользователям. Его преимущества заключаются в отсутствии риска негативного пользовательского опыта или угрозы жизни. Минусы же в том, что моделируемая среда не обеспечивает достаточного объема обратной связи и снижает, но не устраняет необходимость раннего выпуска. В конце концов ИИ придется «отпустить» в реальный мир.
Машинное обучение в облаке и на устройстве
ИИ совершенствуется в реальности, результаты используются для улучшения прогнозов. Как правило, компании собирают данные реальных условий для улучшения машины до выпуска обновленной прогностической модели.
Автопилот Tesla не учится на практике с реальными клиентами. В процессе езды он отправляет данные в облако Tesla, где они накапливаются и используются для обновления автопилота. Затем выпускается следующая версия. Обучение происходит в облаке.
Такой стандартный подход хорош тем, что пользователи защищены от плохо обученных версий. Но у него есть и минусы – обычно ИИ находится на устройстве и не может учитывать быстро меняющиеся местные условия до тех пор, пока их не внесут в обновление; с точки зрения пользователя, улучшения происходят рывками.
Но представьте, что ИИ учится и совершенствуется в реальной среде. Тогда он сможет быстрее реагировать на смену обстановки и оптимизироваться под разные условия. В среде, где все быстро меняется, разумнее улучшать прогностические машины непосредственно на устройствах. В таких приложениях, как Tinder (приложение для знакомств, где движение по экрану влево означает «нет», а вправо – «да»), пользователи быстро принимают много решений подряд. Эти данные сразу загружаются в прогностическую машину для подбора следующего кандидата на свидание. Вкусы у всех разные и непостоянные, меняются и за год, и в течение дня. В случаях, когда пользователи до определенной степени похожи и у них стабильные предпочтения, подходит отправка в облако с последующим обновлением. Но когда вкусы резко расходятся и часто меняются, пригодится способность совершенствовать прогнозы на уровне устройства.
Компании должны искать компромисс в том, как скоро опыт прогностической машины в реальном мире понадобится для составления новых прогнозов. Мгновенное использование опыта обеспечит быструю адаптацию к местным условиям, но ценой качества.
Разрешение учиться