Отложив обсуждение этой важнейшей проблемы до следующей главы, зададимся пока одним чисто практическим вопросом о драйверах развития ИИ. Есть ли экономическая целесообразность в дальнейшем совершенствовании технологий машинного обучения или бизнес может ограничиться достигнутыми успехами, сосредоточив усилия на бизнес-инновациях, то есть на освоении уже открывшихся благодаря слабому ИИ рынков? От ответа на этот вопрос зависит, в частности, объем вложений в разработку сильного ИИ и соответственно время появления последнего.
Представляется, что в силу упомянутого выше эффекта положительной обратной связи тем, кто хотел бы освоить новые рыночные ниши с помощью существующего слабого ИИ, нет смысла ждать дальнейших инноваций. Надо спешить, так как в каждой такой нише действует принцип «победитель забирает все». Так что в 2020-х годах нас ожидает инвестиционный бум новых доткомов, использующих разработанные в 2010-х технологии глубокого обучения.
Драйвером сильного ИИ выступают сегодня уже сформировавшиеся цифровые платформы, обслуживающие глобальные потребительские рынки, те, для кого голосовые помощники представляют собой важнейший канал общения с их пользователями. Ведь для массового пользователя диалог на естественном языке – максимально удобный способ бытового общения со смартфонами, навигаторами, умными колонками и другой домашней электроникой. Именно через своих электронных ассистентов – Google Assistant, Alexa, Cortana и им подобных – современные платформы продвигают свои сервисы в массы. Умные колонки сегодня – один из наиболее быстро растущих сегментов потребительской электроники, поэтому в сегменте голосовых ассистентов наблюдается очень сильная конкуренция. Крупнейшие интернет-компании тратят существенную часть доходов на совершенствование своих голосовых ассистентов.
Разговорный интерфейс – путь к сильному ИИ
Но несмотря на все эти вложения, качество разговорного интерфейса до сих пор оставляет желать лучшего. При этом и распознавание речи у голосовых помощников, и качество их синтетической речи уже вполне удовлетворительны. Их можно и дальше улучшать, в том числе за счет камер, распознающих мимику, жесты и эмоции пользователя. Проблема не в распознавании речи, а в понимании ее смыслового содержания и умении вести осмысленную беседу, то есть в создании того, что можно назвать
Выясняется, что одного сенсорного интеллекта для общения на естественном языке вовсе недостаточно. Распознавание речи лишь самый поверхностный слой настоящего разговорного интеллекта, перевод звукового сигнала в текст. Конечно, благодаря глубокому обучению в машинной обработке текстов тоже имеются большие успехи. Это видно хотя бы по довольно высокому качеству современного машинного перевода. Однако оказывается, что излагать одно и то же содержание на другом языке и делать умозаключения на основе этого содержания – задачи разного уровня сложности. Первое требует наличия у машины
Разговорный интеллект должен обучаться формировать осмысленное поведение в семантическом пространстве, понимая на каждом шаге цели и позиции всех участников диалога, включая свои собственные. Значит, он и сам должен уметь ставить перед собой какие-то цели и добиваться их достижения. Иными словами, машинный перевод еще можно отнести к задачам распознавания образов – отображению исходного текста в его семантическое представление, а последнего – в текст на другом языке. Разговорный же интеллект относится к гораздо более сложному классу задач – обучению адаптивному целесообразному поведению, включая рациональное мышление как разновидность поведения в семантическом пространстве и умение осознанно манипулировать смыслами. А это – прямой путь к настоящему сильному ИИ.