Рис. 40. Образец тренировочного изображения с подписями, сделанными сотрудниками
Сеть-декодер
Как тут не восхититься и, пожалуй, даже не изумиться, что машина может получать изображения в форме необработанных пикселей и выдавать такие точные подписи! Я испытала именно такие чувства, впервые прочитав о полученных результатах в
Рис. 41. Четыре (правильные) подписи, автоматически сгенерированные системой
Другие не стали проявлять такую сдержанность. “Теперь ИИ
Рис. 42. “Не совсем точные” подписи, сгенерированные системой
Но не стоит бежать впереди паровоза. Автоматическая генерация подписей порой впадает в те же крайности, что и машинный перевод. Когда система работает хорошо, как на рис. 41, кажется, что в дело вмешивается магия. Однако, совершая ошибки, она может выдавать как слегка неточные, так и совершенно несуразные подписи. На рис. 42 показано несколько примеров ошибочных подписей. Возможно, они заставят вас рассмеяться, но, если вы человек незрячий и не видите фотографию, вам будет сложно определить, хорошая вам попалась подпись или плохая.
Хотя
Я уверена, что такие системы будут совершенствоваться, по мере того как исследователи будут расширять базы данных и разрабатывать новые алгоритмы. Однако, на мой взгляд, полное отсутствие понимания в сетях генерации подписей неизбежно означает, что эти системы останутся ненадежными, как и системы машинного перевода. В одних случаях они будут работать очень хорошо, а в других – с треском проваливаться. Более того, даже когда они будут выдавать в целом верные результаты, часто они не смогут ухватывать суть изображения, если запечатленная на нем ситуация богата смыслом.
Пока еще системы обработки естественного языка, которые классифицируют эмоциональную окраску предложений, переводят документы и описывают фотографии, далеки от человеческого уровня. Тем не менее они полезны для решения многих практических задач, а потому приносят большие прибыли разработчикам. Однако исследователи обработки естественного языка мечтают о создании машины, которая сможет свободно и гибко взаимодействовать с пользователями в реальном времени – в частности, разговаривать с ними и отвечать на их вопросы. В следующей главе мы узнаем о трудностях, возникающих при создании систем ИИ, работающих со всеми нашими запросами.
Глава 13
Спроси меня о чем угодно