Значительная и даже, пожалуй, основная часть исследований, проводимых в США в области распознавания речи, посвящена созданию квазислуховых автоматов для военных целей. Так, по контракту с Министерством обороны США одна фирма разработала "обучающуюся" машину "Кибертрон" типа К-100, предназначенную для распознавания сигналов гидролокационного устройства. Процесс самообучения проводится путем сравнения записей на перфоленту блока памяти сигналов, создаваемых звуколокационным устройством, с последующей записью других сигналов, например сигналов, создаваемых надводным кораблем, которые по своему частотному спектру близки к сигналам от подводных лодок. Машина сравнивает эти сигналы и выдает ответ. Процесс повторяется до тех пор, пока ответ не будет правильным. Обученная таким образом система, по сообщениям американской печати, обеспечивает быстрое и правильное распознавание шумов, подводных лодок с ошибкой не большей, чем у самого опытного оператора гидролокационной станции. Кроме машины типа К-100 фирма разработала другой вариант — "Кибертрон" типа К-200, предназначенный для распознавания слов английской речи.
Сегодня оператору и диспетчеру приходится не только наблюдать, но и активно вмешиваться в производственные процессы, регулировать, управлять ими. В таких случаях управление голосом могло бы существенно облегчить работу. Учитывая это, в нашей стране и за рубежом в последние годы разработан ряд устройств, срабатывающих при произнесении заранее определенных командных слов. Так, например, несколько лет назад в Институте электроники, автоматики и телемеханики Грузинской ССР была создана экспериментальная тележка несколько необычной формы. Ученые научили ее выполнять 7 слов-команд. Как удалось им достичь этого? Если одно и то же слово повторять много раз и притом разными голосами, а затем изучить сделанную запись, то можно найти общие черты, характерные только для данного слова. Составленная на основе такого исследования схема закладывается в машину. И тогда, принимая через микрофон уже знакомые ей сигналы, она реагирует на них включением вполне определенных приборов. Повинуясь командам оператора, металлическая тележка срывается с места и послушно движется вперед, поворачивает налево или направо и по сигналу "стоп" мгновенно останавливается. А ведь вместо металлического зверька легко себе представить "понимающих" устные команды-приказы прокатные станы на заводе, работающие в поле тракторы и любые другие машины.
Интересно отметить и такую деталь: изображение звука так же постоянно для каждого человека, как и отпечатки его пальцев. Криминалисты на Западе уже пытаются использовать это обстоятельство для опознания преступников. А ученые Грузии намерены на этой основе создать машины, выполняющие команды только определенных лиц. В общем, как в сказке: "Сезам, откройся!"
Из литературы известно о создании устройства, производящего по устной команде перестройку радиоприемников на фиксированные волны. Создано также несколько моделей машин для автоматического набора номера телефона голосом. Правда, большинство из них хорошо работает только при настройке на данный голос, причем точность набора составляет в этом случае 97-99%, но без настройки она падает до 50 — 70%.
Изготовлены выключатели, реагирующие на резкие звуковые команды. Оказывается, человеческий голос обладает интересным свойством, называемым "асимметрией огибающей". Особенно большой асимметрией обладают гласные звуки. Прибор, основанный на этом свойстве, "слышит" резко сказанные слова или крик и отключает (в случае опасности) двигатели или другие агрегаты. И вот еще что важно: это устройство способно реагировать на речевые сигналы, которые в 20 раз слабее, чем окружающий шум, — шумы не обладают асимметрией огибающей.
Один из зарубежных институтов разработал станок с программным управлением. От других подобных конструкций этот станок отличается тем, что программу для него составляет электронная счетная машина. Точнее, она не составляет программу, а преобразует в понятную для станка цифровую форму команды, отдаваемые оператором в микрофон (на это уходит всего несколько секунд). Станок, программируемый голосом, позволяет сэкономить время, нужное для перевода величин подачи, глубины резания и т. д. в машинный код, — устройство само выполняет эту работу. Разумеется, программу можно наговорить и заранее, тогда станок будет обрабатывать деталь сам, без оператора. Конструкторы сделали так, что электронной вычислительной машине "безразлично", каким голосом отдается приказ: громким или тихим, басом или дискантом. Ее не смутит и различная интонация, особенное произношение и даже акцент. На входе устройства, управляющего работой станка, стоит "швейцар". Он пропускает только самую суть слова (т. е. то, что отличает данную команду от другой, например "два" от "три" и т. д.). А всяческие "украшения" — то, что ученые называют избыточной информацией, — попросту не воспринимаются машиной.