Читаем Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта полностью

Я загрузил «Быть или не быть» в одну из лучших систем преобразования текста в речь [24]. Из предлагаемых этой системой голосов больше всего мне понравился WillBadGuy: это скрипучий голос героя боевиков. Но звучал он так, будто WillBadGuy получил удар по голове: голосу не хватало беглости. Потом я попробовал искусственный голос десятилетнего подростка, который проскакал весь монолог, шепелявя, как робот. Повышение тона голоса, как при вопросительной интонации в вопросе, в конце каждой строки меня добило. Чтобы приблизиться к речи настоящего актера, система преобразования текста должна уметь не просто распознавать слова, но и интерпретировать их. Однако для этого требуется искусственный интеллект высокого уровня, и человеку еще предстоит долгий путь до реализации этого технологического чуда.

Чтобы узнать больше о современных системах синтеза речи, я отправился в Эдинбург к профессору Саймону Кингу, который специализируется на обучении компьютера речи. Подобно механику, который разбирает и заново собирает мотоцикл, чтобы понять, как он работает, в своих программах Саймон анализирует и реконструирует речь, чтобы узнать больше о вербальной коммуникации. Слушая рассказы Саймона о проблемах, связанных с синтезом речи, я осознал, что, облекая язык в слова, мы совершаем невероятный человеческий подвиг – и принимаем это как должное!

Системе синтеза речи необходимо имитировать способность человека оживлять текст, но, чтобы это сделать, ей придется научиться распознавать определенные характеристики. Текст уже содержит некоторые явные подсказки относительно того, как нужно произносить слова: это, например, орфография и пунктуация. Скажем, вопросительный знак указывает на восходящий тон. Но в дополнение к этому придется учесть и использовать огромное количество внешних знаний, которых нет в самом тексте. Полезным может оказаться словарь произношения, особенно для таких языков, как английский, который не является фонетическим. Но ведь постоянно создаются новые слова, которые нельзя найти в словаре, и они обязательно вызовут проблемы. Саймон отвечает просто: «Обязательно будут ошибки».

Чтобы произведенная компьютером речь звучала убедительно, нужно также, чтобы он попытался извлечь из текста смысл. Возьмем 130-й сонет Шекспира, который начинается так: «Ее глаза на звезды не похожи»[35]. Если бы его читал человек, он бы подчеркнул слова «глаза» и «звезды», чтобы усилить контраст. Этот сонет – сатира на любовную поэзию, в нем целый ряд шаблонных сравнений, которые уж никак не подходят возлюбленной автора. Система синтеза речи должна будет определить функцию каждого слова, ей придется опознать контрастирующие слова, чтобы выбрать для речи соответствующее ударение. Попробуйте послушать этот сонет на своем компьютере в исполнении бесплатного онлайн-синтезатора. Конечно, результат будет комичным, но только потому, что компьютер исковеркает тщательно продуманную иронию.

Системы синтеза речи, производимые крупными технологическими фирмами, становятся лучше и лучше. Но если задать вопрос Алексе, персональному помощнику Amazon Echo, то единственное, что можно получить в ответ, – это короткую фактическую информацию. Очевидно, что сделать это значительно проще, чем прочитать пьесу или стихотворение. Amazon Echo – небольшой цилиндрик, который через микрофон фиксирует ваш голос и реагирует на ваши команды. В настоящее время к созданию более умных помощников подключились другие компании. Дело здесь в элементарной экономике: если люди покупают всякие голосовые штучки, то компании хотят получать прибыль. Но подобные устройства фиксируют то, чем люди занимаются дома, и предоставляют ценные сведения о поведении, которые тоже можно использовать в коммерческих целях. Большинство людей, по-видимому, не слишком озабочены тем, что посредством технологий раскрывают самые интимные детали своей личной жизни. Однако ввод фразы в поисковое устройство отличается от ситуации, когда компьютер по тону вашего голоса регистрирует случайную информацию, а вы даже не подозреваете, что ее предоставляете.

Беспокоит, однако, то, до какой степени некоторые люди очеловечивают технологические достижения. Дэрен Джилл, директор по управлению продуктами, занимающийся персональным помощником Amazon, в интервью New Scientist отметил: «Каждый день тысячи людей говорят Алексе “доброе утро”» [25]. Сотни тысяч людей объяснились в любви умному домашнему помощнику, а некоторые даже предложили ему руку и сердце. Вы можете представить, что пишете такое письмо своему компьютеру?

Перейти на страницу:

Похожие книги

Древний Египет
Древний Египет

Прикосновение к тайне, попытка разгадать неизведанное, увидеть и понять то, что не дано другим… Это всегда интересно, это захватывает дух и заставляет учащенно биться сердце. Особенно если тайна касается древнейшей цивилизации, коей и является Древний Египет. Откуда египтяне черпали свои поразительные знания и умения, некоторые из которых даже сейчас остаются недоступными? Как и зачем они строили свои знаменитые пирамиды? Что таит в себе таинственная полуулыбка Большого сфинкса и неужели наш мир обречен на гибель, если его загадка будет разгадана? Действительно ли всех, кто посягнул на тайну пирамиды Тутанхамона, будет преследовать неумолимое «проклятие фараонов»? Об этих и других знаменитых тайнах и загадках древнеегипетской цивилизации, о версиях, предположениях и реальных фактах, читатель узнает из этой книги.

Борис Александрович Тураев , Борис Георгиевич Деревенский , Елена Качур , Мария Павловна Згурская , Энтони Холмс

Культурология / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / История / Детская познавательная и развивающая литература / Словари, справочники / Образование и наука / Словари и Энциклопедии