Наше исследование власти голоса завершилось темой молчания, которое заставляет вернуться к себе и своему внутреннему голосу, к тому, что именуют «таинственным садом». Однако нейрофизиология собирается разрушить этот «сад», вооружившись кортикографией, которая представляет собой метод регистрации активности головного мозга с помощью электродов, которые накладываются на открытый участок мозга после трепанации черепа. В настоящее время доказано, что говорящий человек автоматически испускает звуковые волны, в чем ему содействует группа клеток и особых нейронов, расположенных во внутреннем ухе. Эти волны, испускаемые во время разговора, уже расшифрованы благодаря внутримозговым сигналам, которые датчики воспроизводят на графике в виде кривой. Так как слышимый голос и голос «внутренний» мобилизуют одни и те же нейронные цепочки, разве не можем мы предположить, что похожие датчики можно использовать и для расшифровки внутреннего голоса? А значит, мы могли бы услышать испытуемого, который не может или не желает говорить вследствие перенесенного шока, как, например, при психогенной афонии или синдроме изоляции. Это очень перспективное исследование, которым занимаются профессор Брайан Пейсли из Калифорнийского университета в Беркли и команда Стефани Мартэн из Лозанны. Возможно, скоро мы услышим через наушники внутренний беззвучный голос. Эти технологические прорывы ставят, среди прочих, вопрос о том, какой будет власть голоса в ближайшем будущем.
Идея научиться распознавать человеческий голос существует столько же, сколько и сам мир вычислительной техники. Уже сорок лет люди пытаются управлять объектами с помощью речи. Много раз исследователи заявляли о революционном прорыве в этом вопросе, но он так и не произошел, несмотря на то что голос является самым естественным связующим звеном между человеком и техникой. Если сегодня мы умеем посылать короткие голосовые сообщения, то завтра наш голос смогут распознавать подключенные к интернету объекты (наручные часы, автомобиль, термостат, холодильник). Программы мгновенного обмена сообщениями, существующие уже сегодня, можно даже назвать «великим возвращением голоса», ведь одно простое голосовое сообщение за 10–15 секунд способно передать идею, тон, эмоцию эффективнее, быстрее и естественнее, чем клавиатура.
В сложной технологической среде, в которой мы находимся, голос скоро станет самым простым средством воздействия на повседневную жизнь. Система голосовых помощников начала революцию благодаря приложениям к смартфонам. Стало возможным идентифицировать песню, если ее просто промурлыкать или даже спеть фальшиво! Кажется, ни один нюанс не ускользнет от этого супер-уха. Ухо служит проводником голосу, и если мы можем закрыть глаза, чтобы не видеть, то у барабанной перепонки нет век, зато она фильтрует всё, что мы слушаем.
До сих пор голосовые помощники в первую очередь идентифицировали слова, а затем их смысл. Теперь целью стало объединение этих двух этапов.
Желание говорить с объектом, который не реагирует или реагирует неестественно, может показаться странным; в общем, разговор с машиной – это не что-то само собой разумеющееся. Но привычки меняются, искусственные голоса все больше похожи на настоящие, и взаимодействие с объектами, подключенными к интернету, этими «умными» объектами без экрана и клавиатуры, практически разработано.
Помимо того что власть голоса влияет на наш внутренний комфорт и повседневную жизнь, его роль в ближайшем будущем уже давно изучается Институтом исследования и координации акустики и музыки (
Цель синтеза речи состоит в том, чтобы получить голос, максимально похожий на человеческий. Здесь работают с понятием «голосовой идентичности», другими словами, с вокальным автографом человека.
В связи с этим актер Андре Дюссолье любезно согласился ради эксперимента лишиться на время своего прекрасного голоса! Для того чтобы синтезировать голос, понадобились многие часы звукозаписи. Затем его фонограмму разрезали на слова, слоги, фонемы, а их характеристики были проанализированы и собраны таким образом, чтобы, оказавшись вместе, они могли создать любое слово и любое произношение, сохранив естественное звучание первоначального голоса. Вокальный автограф человека – это его просодия: комбинация ритма, паузы и интонации. Эта технология позволила смоделировать манеру речи Андре Дюссолье. Меняя тембр, мы добились большей выразительности и эмоций. Таким образом, мы услышали синтетический голос Дюссолье, читающий «Красную Шапочку». Пораженный результатом, актер признался, что даже его близкие не смогли бы различить, кто говорит – он сам или машина…