В главе 4
мы отдельно подчеркнули «неизвестные известные». Это, к примеру, трудности в принятии решения о том, рекомендовать ли данную книгу друзьям, даже если вы достигнете невообразимых успехов в управлении ИИ. Сложность заключается в отсутствии данных о том, что произошло бы, если бы вы ее не прочитали. Если хотите разобраться, что именно служит причиной чего бы то ни было, необходимо знать развитие событий вследствие иных действий.У людей есть два решения этой проблемы: эксперименты и моделирование. Если ситуация возникает достаточно часто, можно провести рандомизированное контролируемое испытание. Наберите людей в экспериментальную группу (заставьте прочитать книгу или хотя бы раздайте всем и затем проэкзаменуйте на знание материала) и контрольную (не разрешайте читать книгу или просто не рекламируйте). Через некоторое время проверьте, как они применяют ИИ в своей работе. Сравните результаты двух групп. Разница между экспериментальной и контрольной группами и станет результатом прочтения всей книги.
Такие эксперименты весьма эффективны. Без них не одобряют новые лекарственные препараты. Благодаря им принимают решения работающие с данными компании, от Google до Capital One. Машины тоже могут проводить эксперименты. При достаточной частоте событий способность экспериментировать присуща не только людям.
Машины экспериментируют и учатся причинно-следственной связи на примерах, как и люди. Это основная причина, по которой машины обыгрывают человека в видеоиграх.
Решение ZipRecruiter по ценообразованию, описанное нами ранее, состоит из двух частей. Первая – это определение «оптимальной» цены: краткосрочный доход или долгосрочные перспективы? Больше соискателей и рекламодателей или высокие цены? Вторая – выбор конкретной цены. Для решения этой задачи использовали эксперимент. Его придумали квалифицированные специалисты, но теоретически с развитием ИИ и при достаточном количестве рекламодателей и времени такие эксперименты можно автоматизировать.
Гораздо сложнее автоматизировать определение значения «оптимальный». Поскольку число соискателей зависит от количества объявлений о вакансиях и наоборот, результат наблюдений рынка только один. Если ошибиться, ZipRecruiter может обанкротиться и не получить второй шанс. Поэтому она использовала бизнес-моделирование: изучила последствия увеличения краткосрочной выгоды и сравнила с альтернативной моделью, целью которой было увеличение выгоды за долгий срок. При отсутствии данных моделирование исходов и разработка функции вознаграждения осуществляются людьми, пусть даже только самыми компетентными.
Моделирование помогло странам – союзникам СССР проводить воздушные атаки во время Второй мировой войны. Инженеры придумали, как лучше оснастить бомбардировщики, увеличив грузоподъемность самолетов без потери летных качеств. Вопрос заключался в том, какие части самолетов требуется защитить. Эксперименты были возможны, но ценой крупных издержек. Они стоили бы пилотам жизни.
Инженеры осматривали каждый бомбардировщик, вернувшийся с воздушной атаки на Германию. Данными для них служили пулевые отверстия. Но там ли следовало укреплять обшивку?
За оценкой проблемы обратились к статистику Абрахаму Вальду[75]
. После размышлений и подробных расчетов он порекомендовал установить защиту на те части обшивки самолетов, куда пули не попадали. Может быть, Вальд что-то перепутал? Его совет противоречил здравому смыслу. Возможно, он имел в виду «на места, куда пули попали»? Нет. Он смоделировал процесс генерации данных. Зная, что некоторые самолеты были подбиты, он предположил, что смертоносные пули должны были попасть в другие части обшивки, ведь уцелевшим самолетам они не нанесли существенного урона. С учетом этого авиационные инженеры укрепили обшивку, и бомбардировщики теперь защищены лучше[76].Концепция Вальда об отсутствующих данных требует понимания, откуда они поступают; поскольку такой проблемы раньше не возникало, у инженеров не было примеров, из которых они могли бы исходить. В обозримом будущем такие расчеты не будут доступны прогностическим машинам.
Решение такой сложнейшей проблемы удалось не машине, а человеку, лучшему статистику в истории XX века. Абрахам Вальд хорошо разбирался в математической статистике и обладал гибким умом, что позволило ему понять процесс генерации данных.
Человека можно обучить навыкам моделирования. Это одна из главных дисциплин программ аспирантуры по экономике и МБА (в том числе разработанного нами курса для Университета Торонто). Такие навыки необходимы для работы с прогностическими машинами, иначе легко угодить в ловушку неизвестных известных. Прогнозы, где перепутаны причина и следствие, вводят в заблуждение.