Читаем Воспитание машин. Новая история разума полностью

Отложив обсуждение этой важнейшей проблемы до следующей главы, зададимся пока одним чисто практическим вопросом о драйверах развития ИИ. Есть ли экономическая целесообразность в дальнейшем совершенствовании технологий машинного обучения или бизнес может ограничиться достигнутыми успехами, сосредоточив усилия на бизнес-инновациях, то есть на освоении уже открывшихся благодаря слабому ИИ рынков? От ответа на этот вопрос зависит, в частности, объем вложений в разработку сильного ИИ и соответственно время появления последнего.

Представляется, что в силу упомянутого выше эффекта положительной обратной связи тем, кто хотел бы освоить новые рыночные ниши с помощью существующего слабого ИИ, нет смысла ждать дальнейших инноваций. Надо спешить, так как в каждой такой нише действует принцип «победитель забирает все». Так что в 2020-х годах нас ожидает инвестиционный бум новых доткомов, использующих разработанные в 2010-х технологии глубокого обучения.

Драйвером сильного ИИ выступают сегодня уже сформировавшиеся цифровые платформы, обслуживающие глобальные потребительские рынки, те, для кого голосовые помощники представляют собой важнейший канал общения с их пользователями. Ведь для массового пользователя диалог на естественном языке – максимально удобный способ бытового общения со смартфонами, навигаторами, умными колонками и другой домашней электроникой. Именно через своих электронных ассистентов – Google Assistant, Alexa, Cortana и им подобных – современные платформы продвигают свои сервисы в массы. Умные колонки сегодня – один из наиболее быстро растущих сегментов потребительской электроники, поэтому в сегменте голосовых ассистентов наблюдается очень сильная конкуренция. Крупнейшие интернет-компании тратят существенную часть доходов на совершенствование своих голосовых ассистентов.

Разговорный интерфейс – путь к сильному ИИ

Но несмотря на все эти вложения, качество разговорного интерфейса до сих пор оставляет желать лучшего. При этом и распознавание речи у голосовых помощников, и качество их синтетической речи уже вполне удовлетворительны. Их можно и дальше улучшать, в том числе за счет камер, распознающих мимику, жесты и эмоции пользователя. Проблема не в распознавании речи, а в понимании ее смыслового содержания и умении вести осмысленную беседу, то есть в создании того, что можно назвать разговорным интеллектом.

Выясняется, что одного сенсорного интеллекта для общения на естественном языке вовсе недостаточно. Распознавание речи лишь самый поверхностный слой настоящего разговорного интеллекта, перевод звукового сигнала в текст. Конечно, благодаря глубокому обучению в машинной обработке текстов тоже имеются большие успехи. Это видно хотя бы по довольно высокому качеству современного машинного перевода. Однако оказывается, что излагать одно и то же содержание на другом языке и делать умозаключения на основе этого содержания – задачи разного уровня сложности. Первое требует наличия у машины семантического пространства, в котором отражается содержание предложений, тогда как второе предполагает умение оперировать в этом семантическом пространстве, прокладывать в нем осмысленные траектории – рассуждения.

Разговорный интеллект должен обучаться формировать осмысленное поведение в семантическом пространстве, понимая на каждом шаге цели и позиции всех участников диалога, включая свои собственные. Значит, он и сам должен уметь ставить перед собой какие-то цели и добиваться их достижения. Иными словами, машинный перевод еще можно отнести к задачам распознавания образов – отображению исходного текста в его семантическое представление, а последнего – в текст на другом языке. Разговорный же интеллект относится к гораздо более сложному классу задач – обучению адаптивному целесообразному поведению, включая рациональное мышление как разновидность поведения в семантическом пространстве и умение осознанно манипулировать смыслами. А это – прямой путь к настоящему сильному ИИ.

Перейти на страницу:

Похожие книги

Цивилизационные паттерны и исторические процессы
Цивилизационные паттерны и исторические процессы

Йохан Арнасон (р. 1940) – ведущий теоретик современной исторической социологии и один из основоположников цивилизационного анализа как социологической парадигмы. Находясь в продуктивном диалоге со Ш. Эйзенштадтом, разработавшим концепцию множественных модерностей, Арнасон развивает так называемый реляционный подход к исследованию цивилизаций. Одна из ключевых его особенностей – акцент на способности цивилизаций к взаимному обучению и заимствованию тех или иных культурных черт. При этом процесс развития цивилизации, по мнению автора, не всегда ограничен предсказуемым сценарием – его направление может изменяться под влиянием креативности социального действия и случайных событий. Характеризуя взаимоотношения различных цивилизаций с Западом, исследователь выделяет взаимодействие традиций, разнообразных путей модернизации и альтернативных форм модерности. Анализируя эволюцию российского общества, он показывает, как складывалась установка на «отрицание западной модерности с претензиями на то, чтобы превзойти ее». В представленный сборник работ Арнасона входят тексты, в которых он, с одной стороны, описывает основные положения своей теории, а с другой – демонстрирует возможности ее применения, в частности исследуя советскую модель. Эти труды значимы не только для осмысления исторических изменений в домодерных и модерных цивилизациях, но и для понимания социальных трансформаций в сегодняшнем мире.

Йохан Арнасон

Обществознание, социология
Живым голосом. Зачем в цифровую эру говорить и слушать
Живым голосом. Зачем в цифровую эру говорить и слушать

Сегодня мы постоянно обмениваемся сообщениями, размещаем посты в социальных сетях, переписываемся в чатах и не замечаем, как экраны наших электронных устройств разъединяют нас с близкими. Даже во время семейных обедов мы постоянно проверяем мессенджеры. Стремясь быть многозадачным, современный человек утрачивает самое главное – умение говорить и слушать. Можно ли это изменить, не отказываясь от достижений цифровых технологий? В книге "Живым голосом. Зачем в цифровую эру говорить и слушать" профессор Массачусетского технологического института Шерри Тёркл увлекательно и просто рассказывает о том, как интернет-общение влияет на наши социальные навыки, и предлагает вместе подумать, как нам с этим быть.В формате PDF A4 сохранён издательский дизайн.

Шерри Тёркл

Обществознание, социология