Исследованиями было установлено, что подавляющая часть «звуковой энергии» человеческой речи сосредоточена в пяти типовых областях частот: от 200 до 3500 герц. Эта шкала разбивается на пять фонем, каждая из которых генерируется своей специально настроенной звуковой схемой. Управление частотой и амплитудой каждой схемы, а также очередностью их срабатывания поручается компьютеру. В результате определенных последовательностей включения генерирующих схем и возникают необходимые звуки «человеческого голоса».
Однако качество работы машины, полностью синтезирующей речь, в большой степени зависит от того, насколько удачно удается электронная имитация смеси переходных шумов между отдельными звуками, поскольку эти шумы играют определяющую роль для понимания языка вообще и, следовательно, искусственного языка в частности. Еще более усложняет все дело то, что они бывают чрезвычайно разнообразными, зависят от того, в какой последовательности произносятся гласные и согласные, от скорости и громкости произнесения слов и т. д. и т. п.
Еще недавно как великую экзотику демонстрировали кибернетики системы, полностью синтезирующие человеческую речь, а уже поступают сообщения о серийном выпуске говорящих часов, фотокамер и светофоров.
Это следствие появления на рынке близкого родственника современного микропроцессора — который назван voiceprocessor (от английского слова «voice» — голос).
Что-то вроде «процессор для синтеза голоса» или «голосистый процессор». Такое устройство программируется как обычный компьютер и может синтезировать электронную копию волнового спектра, возникающего при произнесении слов. Этим машина похожа на читающего, который, правда, не имеет понятия о смысле прочитанного.
Лингвистические способности роботов не только «оживили» безгласные вещи, но и помогают человеку в его «разговорной деятельности»; например, созданы карманные компьютеры, используемые в качестве помощников при переводе, которые «выговаривают» отдельные слова с правильным произношением на нужном языке; или целые роботы-переводчики, которые могут осуществлять перевод международных разговоров несложного бытового содержания. Такова, например, система перевода английский — японский. Память робота содержит около восьми тысяч фонем слов, четыреста идиом, примерно тысячу грамматических правил обоих языков. Она почти не отличается от аналогичных интеллектуальных переводчиков. Шагом вперед явилось ее объединение с распознавателем и синтезатором речи.
Одна из фирм в ФРГ, занимающаяся выполнением заказов по пересылке, давно использует в своей деятельности компьютер, который отвечает на звонок человеческим голосом, робот подтверждает получение заказа или же сообщает о невозможности его выполнения, закончив разговор, говорит «спасибо» и «до свидания».
Хорошо трудится вот уже почти два года «Карлуша» — крупная железнодорожная справочная система: абонент называет вокзал назначения и без промедления получает устную справку о поездах, следующих в данном направлении, времени и вокзалах, в которых можно сделать удобную пересадку.
Постоянно растущий объем информации требует новых путей и методов ведения информационно-справочной работы. Все острее ощущается нехватка людей, времени и средств для компетентных ответов на вопросы из всех областей знания. В будущем тут могут помочь лишь понимающие язык и могущие «изъясняться» роботы, снабженные «банками памяти».
Серьезные усилия, прилагаемые в области создания машин, понимающих человеческую речь и отвечающих людям, наглядно свидетельствуют о том, что речь при этом идет не о каких-то игрушках. Взаимодействие с машиной на языковом уровне позволит людям, не обладающим специальными знаниями, эффективно пользоваться компьютерами и роботами.
МИДИ, МИНИ, МИКРО…