Первые акустические системы безошибочно распознавали лишь отдельно сказанные буквы алфавита, следующие — отдельные слова команд, четко произнесенные в микрофон. Однако понимающий робот «слушался» лишь голоса своего «хозяина» и делал это очень хорошо. Во время работы он самостоятельно приспосабливался к «постоянно меняющейся языковой манере человека». Другим людям, которые вступали в контакт с роботом и произносили в микрофон буквы или цифры, удавалось его «обмануть». Но это бывало лишь тогда, когда голос говорящего напоминал голос «хозяина». Конечно, «привыкание» машины к другим голосам не связано с какими-то непреодолимыми трудностями, просто компьютер вырабатывает «модель голоса данного индивидуума». Для этого необходимо ввести в память ряд звуковых проб со словами, которые машина должна понимать.
Можно не сомневаться, что в будущем понимающие наш язык аппараты, если мы хотим, чтобы они утвердились в производстве и быту, должны обладать такой степенью приспособляемости, чтобы узнавать голоса любых людей и выполнять любые команды.
В настоящее время уже нашли применение около пятисот систем распознавания речи. Они используются при контроле качества продукции на конвейерах, при управлении станками, сортировке товаров и багажа в аэропортах, с целью включения электроприборов, вызова врача или медсестры, в системах программированного обучения, опознавания личности и т. д. и т. п.
Имеются практические примеры применения понимающих речь роботов и в непромышленной сфере.
Системы, распознающие печатный текст, уже не новость. Но вот эта особенная. Сконструированы роботы, которые работают в паре — один переворачивает страницы текста, а другой… читает слова приятным женским голосом. Точность распознавания 99,5 процента. Эти роботы могут излагать последние известия по радио и отвечать на вопросы по телефону. Конструкторы создали механического чтеца вовсе не для рекламы, ему уже уготовано рабочее место — он будет служить в автоматизированной телефонной справочной службе.
Конечно, можно и специально ввести в компьютер всю необходимую справочную информацию; но зачем делать еще раз то, что уже однажды сделано, ведь телефонные книги и справочники уже отпечатаны, они и в будущем будут переиздаваться и корректироваться, ими будут пользоваться люди… а теперь еще и роботы.
Да! Общение с человеком пошло роботу на пользу, он получил еще одну чисто человеческую привилегию — заговорил. Таким образом, к привычным механическим эффекторам робота добавилось еще одно немаловажное устройство — синтезатор речи.
Машина, которая «говорит», не такая уж новинка, к примеру обыкновенный магнитофон. Однако он, к сожалению, «говорит» только то, что записано на пленку, то, что заранее «наговорил» ему человек. С подобной говорящей машиной можно легко «побеседовать», достаточно лишь набрать номер московских «говорящих часов» 100.
А что, если наговорить кучу самых разных слов и поручить компьютеру находить и воспроизводить нужные слова в нужной последовательности в процессе разговора? Получится ли правильная человеческая речь?
Вряд ли. Ведь одно и то же слово участвует в предложениях разного типа с десятком интонаций, сотнями вариантов произношения. Чтобы такая речь мало-мальски «ласкала слух», потребуется слишком большая куча вариантов произнесения слов и, следовательно, слишком длительный поиск нужного варианта. Все это окажется слишком дорого. Хорошо бы, задумались конструкторы, создать машину, которая бы не воспроизводила заранее записанные фрагменты, а говорила сама, то есть синтезировала речь, подобно человеку.
Историю говорящих машин следовало бы начать с глубины веков. Самые первые были тщательными моделями человеческого речевого аппарата. Кузнечный мех вдувал мощную струю воздуха в кожаную гортань, язычки и резонаторы, управляемые набором рычагов, вибрировали, и машина «говорила». Достоверно известна одна из конструкций такого типа, построенная В. фон Кемпелиа в конце XVIII века. Она неплохо имитировала человеческую речь, хотя не совсем правильно произносила некоторые звуки. В 1920 году Р. Пэджет демонстрировал акустическую модель речевого аппарата, которая удивляла слушателей целыми фразами, например: «О Лейла, я люблю вас!» или: «Алло, Лондон, Вы слушаете?» Изобретатель, манипулируя руками, очень искусно изменял форму резонирующей полости механической гортани — и одна фраза менялась на другую.
Как это неоднократно происходило в истории техники, механический принцип копирования благополучно завершил серию тщетных потуг и новая фаворитка человечества — электроника прочно уселась на его место.