Данные неоправданно эффективны – звучит интригующе и точно. Это объясняет, почему мы можем создать классификатор, способный с точностью 97 % предсказать смерть пассажиров «Титаника», и почему компьютер может обыграть чемпиона по го. Это также объясняет, почему, когда мы обращаем внимание на то, что именно происходит в момент обучения компьютера, мы понимаем, что машина не учитывает множества случайностей, которые происходят в случае реальных катастроф. Данные действительно эффективны. Однако подход, основанный на данных, не учитывает множества факторов, которые – по мнению людей – оказываются значительными.
Закон и общество пытаются вместить все, что люди узнали о материальном мире. Решения, основанные на данных, редко вписываются в эту сложную систему правил. Бессмысленность данных мы можем наблюдать в случае машинного перевода, голосовых помощников и распознавания рукописей. Слова и их комбинации компьютер не понимает так, как их понимает человек. Поэтому статистические методы распознавания речи и машинного перевода полагаются на вероятности и огромные массивы данных коротких последовательностей слов, или N-граммы. Десятилетиями лучшие умы компании Google работали над этим, им удалось собрать больше данных, чем кому-либо. Архив Google, архив
Принятие социальных решений связано не только с вычислениями, и проблемы будут возникать всегда, когда мы будем использовать только данные там, где нужно обращаться к общественным и ценностным суждениям. Действительно, путешествие 1-м классом на «Титанике» могло повысить шанс на выживание, но неразумно на основе этого развивать модель, согласно которой пассажиры 1-го класса заслуживают получить шанс на выживание в крушении больше тех, кто путешествует 2-м или 3-м классом. На основе этой модели не стоит строить какие-либо предположения. Наша прогностическая модель могла бы пригодиться для того, чтобы объяснить, почему для пассажиров 1-го класса можно было предложить более дешевую страховку, но это абсурд: нельзя наказывать тех, кто недостаточно богат, чтобы путешествовать 1-м классом. Но важнее всего то, что мы должны понимать, что есть вещи, которые машины никогда не смогут понять о людях, поэтому будут всегда востребованы человеческие: суждение, подтверждение и интерпретация.
8
Эта машина сама не поедет
Массивы неоправданно эффективных данных хорошо работают применительно к электронному поиску, простому переводу и навигации. И при достаточном объеме обучающих данных алгоритмы действительно могут неплохо справляться с разными повседневными задачами, в то время как человеческая смекалка помогает заполнить «пробелы» ИИ. Благодаря поисковикам мы научились использовать как сложные комплексные запросы, так и конкретные термины (или их синонимы), что позволяет нам при помощи строки поиска находить определенные веб-страницы. Машинный перевод между языками сегодня развит лучше, чем когда-либо. Он, конечно, не так хорош, как человеческий, однако человеческий мозг превосходно справляется с интерпретациями значений и искаженных сентенций. Обычного пользователя вполне удовлетворяет высокопарный, неуклюжий машинный перевод веб-страниц. Системы GPS, помогающие добраться из пункта А в пункт Б, невероятно удобны. Если спросить любого профессионального таксиста или водителя-попутчика, они скажут, что GPS не предлагают
И все же у массивов неоправданно эффективных данных есть ряд недостатков, из-за которых я скептически отношусь к замене человека ИИ в потенциально опасных случаях вроде вождения. Беспилотные автомобили наилучшим образом показывают, как ИИ (не) состоятелен в данном случае.