С достаточным объемом данных машинный прогноз чаще всего верен. Машине известна ситуация, она выдает качественный прогноз, и мы убеждаемся в этом. Вот что составляет зону комфорта нынешнего поколения машинного интеллекта: выявление мошенничества, медицинская диагностика, бейсбол и решения по выпуску осужденных под залог – все попадает в эту категорию.
Известные неизвестные
Даже лучшие на сегодня (и ближайшее будущее) прогностические модели требуют огромного количества данных. Следовательно, в случаях, когда их не хватает, точность прогноза соответственно понизится. Мы знаем, чего мы не знаем: известные неизвестные.
Недостаток данных обычно сопутствует достаточно редко происходящим событиям, поэтому их прогнозировать сложно. Президентские выборы в США проводятся только раз в четыре года, а кандидаты и политическая обстановка всегда разные. Предугадать итоги президентских выборов на несколько лет вперед практически невозможно. Как показали выборы 2016 года, трудно предположить итоги даже недели или хотя бы одного дня. Крупные землетрясения тоже достаточно редки (к счастью), и прогнозировать, когда они произойдут, где и с какой интенсивностью, пока нереально (но сейсмологи работают над этим)[50]
.В отличие от машин, людям иногда отлично удаются прогнозы на основе ограниченного объема данных. Мы опознаём лица, даже если видели их лишь пару раз и в другом ракурсе. Сорок лет спустя мы узнаём одноклассника, с которым учились в четвертом классе, как бы он ни изменился внешне. С ранних лет мы угадываем траекторию полета мяча (даже если у нас еще недостаточно развита координация, чтобы его поймать). Мы легко проводим аналогии, усмотрев схожие с прошлым опытом обстоятельства в новой ситуации. Например, ученые в течение нескольких десятилетий представляли атом как миниатюрную солнечную систему, и во многих школах его до сих пор так и описывают[51]
.IT-специалисты стараются снизить потребность машин в данных и разрабатывают такие методы, как «обучение на одном примере», в которых машины учатся прогнозировать объекты, увидев их единожды, но полный успех пока не достигнут[52]
. Поскольку люди пока лучше умеют прогнозировать на основе известных неизвестных, можно запрограммировать машины так, чтобы в подобных ситуациях они призывали человека на помощь.Неизвестные неизвестные
Чтобы машина выдала прогноз, ей необходимо указать, что именно следует прогнозировать. Если какое-то событие не происходило никогда, машина не сможет с ним работать (во всяком случае, без предоставления человеком сформулированного суждения с адекватной аналогией, позволяющей сделать прогноз с использованием информации о других событиях).
В книге «Черный лебедь»[53]
Нассим Николас Талеб подчеркивает значение неизвестных неизвестных[54]. Он утверждает, что мы не можем на основе прошлого опыта прогнозировать то, чего в нем не было. Название книги навеяно открытием в Австралии нового вида лебедей, совершенным европейцами. В XVIII веке в Европе считалось, что лебеди бывают только белыми. Прибыв в Австралию, европейцы увидели нечто совершенно новое и неожиданное: черных лебедей. Никто их раньше не видел и поэтому не имел оснований предполагать, что они существуют[55].Талеб считает, что появление неизвестных неизвестных приводит к серьезным последствиям – в отличие от черных лебедей, которые не повлияли на общество Европы и Австралии.
Возьмем, к примеру, расцвет музыкальной индустрии в 1990-х[56]
. Продажи компакт-дисков увеличивались, доход стабильно рос. Будущее выглядело оптимистично. Но в 1999 году восемнадцатилетний Шон Фэннинг придумал Napster – программу, позволяющую людям бесплатно обмениваться музыкальными файлами в интернете. Вскоре были загружены миллионы таких файлов, и доходы от продажи дисков начали снижаться. Индустрия до сих пор не оправилась от этого краха.Фэннинг стал неизвестной неизвестной, машины не смогли бы прогнозировать его появление. Стоит согласиться с мнением Талеба и многих других – людям тоже плохо дается прогноз неизвестных неизвестных. Перед ними пасуют и люди, и машины.
Неизвестные известные
Возможно, самый большой недостаток прогностических машин заключается в неверных прогнозах, причем обоснованных. Как мы уже обсудили, в случае известных неизвестных люди предполагают неточности в прогнозе: он выдается с доверительным интервалом, из чего следует вероятность погрешностей. О неизвестных неизвестных люди ничего не знают. При наличии же неизвестных известных прогностическая машина выдает точный прогноз, но он может быть очень далек от истины.