Читаем Наш коллега - робот полностью

Постоянно «общаясь» с человеком, робот вынужден научиться понимать человеческий язык, реагировать на команды, задаваемые не только нажатием кнопок, но и команды, отдаваемые голосом. Это куда более «привычное» для человека средство общения и верный путь для расширения популярности роботов. Однако проблема «взаимопонимания» человека и машины куда сложнее, чем трудности общения даже двух людей, говорящих на разных языках. История сохранила немало курьезов подобного «понимания». Так, английский капитан Дж. Кук, вторично «открывший» Австралию, писал в своем дневнике о «странном существе, которое скачет на задних лапах, как прыгающая мышь». Когда Дж. Кук справлялся о нем у местных жителей, туземцы отвечали одним словом «кенгуру». Современные языковеды установили, что на языке туземцев «кенгуру» означает всего лишь «я тебя не понимаю»! А ведь язык человека и язык компьютера разнятся буквально как «лед и пламень».

Надо сказать, что человеческий язык уже давно «волновал» умы машин. Приборы, читающие печатный текст и являющиеся, как правило, частями других, более сложных устройств, уже перестали быть технической новинкой. Достаточно вспомнить почтовые автоматы, сортирующие корреспонденцию в зависимости от шестизначного почтового индекса. Однако такие примитивные устройства способны «понимать» лишь сильно стилизованный текст, написанный по заданному трафарету. А как же простой печатный шрифт? Неужели нужно специально переписывать для робота миллионы человеческих книг?

Вот последнее достижение в этой области — читающий компьютер третьего поколения. Он «умнее» своих предшественников — читает тексты, отпечатанные шрифтами двадцати пяти различных видов. «Тренировочная фаза» в течение 15–20 минут позволяет прибору переходить на другой вид шрифта. Машина работает по принципу «оптического ощупывания» со скоростью 20–30 печатных знаков в секунду. Существуют и разработки, нацеленные на распознавание рукописного текста.

Однако проблема восприятия информации «с голоса» гораздо сложнее. Печатный текст формируется из четких знаков — букв, живая речь из атомов речи — звуков или, как их называют специалисты, — фонем (отсюда «фонетика» — наука о правильном произношении). Как объект физического анализа каждый звук речи отличается от другого и частотой, и продолжительностью, и интенсивностью. Кроме того, в речи нет четких границ между звуками, как между буквами в тексте, и это сильно затрудняет распознавание по сравнению с любым печатным текстом. Одни специалисты пытаются распознавать речь по частотным характеристикам, присущим звучанию каждой буквы (заметим, что в некоторых буквах несколько фонем). Другие — по группе фонем, составляющих слог, так как распознавание многих фонем вне контекста очень трудно.

Для того чтобы понять, сколь сложна проблема звукового распознавания человеческой речи, уместно привести такой почти анекдотический пример. В одном научно-исследовательском институте, расположенном на Кавказе, была построена кибернетическая черепаха, которая выполняла фиксированный набор команд, подаваемых голосом. На торжественную демонстрацию съехались гости. Черепаха была послушна своим создателям, но «принципиально» отказалась слушаться гостей. Как выяснилось в результате пристрастного разбирательства, гостям она не повиновалась по одной простой причине… команды нужно было произносить с «кавказским акцентом». То, что мы называем кавказским акцентом, всего лишь связано с повышенным участием в произношении некоторых звуков гортани.

Проблема машинного слуха настолько сложна, что не имеет имитационных аналогов механического моделирования в глубинах истории. Анналы техники не сохранили нам достоверных сведений о слушающих андроидах. То ли слуховой аппарат человека оказался слишком замысловатым для чисто механического подражания, то ли роль мозга оказалась слишком велика в слуховом процессе, по крайней мере, проблема машинного слуха так же, как и зрения, стала актуальной лишь на электронном уровне. К сожалению, известный нам микрофон еще меньше напоминает человеческое ухо, чем телекамера человеческий глаз.

Имевшиеся в распоряжении ученых ЭВМ поначалу с трудом справлялись с предлагаемым им объемом «распознавательных» работ. Они реагировали далеко не на каждый голос, а лишь на тот, на который они настроены заранее. К тому же у них был ограниченный словарный запас.

Загвоздка состоит в следующем: число возможных вариантов спектра фонем, учитывая словарное богатство каждого языка, выражается астрономической величиной, и это не считая того, что спектры даже одинаковых слов разнятся в зависимости от индивидуума, их произносящего. Более того, даже один и тот же человек в течение одной недели, даже нескольких часов будет произносить одни и те же слова совершенно по-разному.

Перейти на страницу:

Все книги серии Эврика

Похожие книги

27 принципов истории. Секреты сторителлинга от «Гамлета» до «Южного парка»
27 принципов истории. Секреты сторителлинга от «Гамлета» до «Южного парка»

Не важно, что вы пишете – роман, сценарий к фильму или сериалу, пьесу, подкаст или комикс, – принципы построения истории едины для всего. И ВСЕГО ИХ 27!Эта книга научит вас создавать историю, у которой есть начало, середина и конец. Которая захватывает и создает напряжение, которая заставляет читателя гадать, что же будет дальше.Вы не найдете здесь никакой теории литературы, академических сложных понятий или профессионального жаргона. Все двадцать семь принципов изложены на простом человеческом языке. Если вы хотите поэтапно, шаг за шагом, узнать, как наилучшим образом рассказать связную. достоверную историю, вы найдете здесь то. что вам нужно. Если вы не приемлете каких-либо рамок и склонны к более свободному полету фантазии, вы можете изучать каждый принцип отдельно и использовать только те. которые покажутся вам наиболее полезными. Главным здесь являетесь только вы сами.В формате PDF A4 сохранен издательский макет книги.

Дэниел Джошуа Рубин

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Зарубежная прикладная литература / Дом и досуг
История Бога: 4000 лет исканий в иудаизме, христианстве и исламе
История Бога: 4000 лет исканий в иудаизме, христианстве и исламе

Откуда в нашем восприятии появилась сама идея единого Бога?Как менялись представления человека о Боге?Какими чертами наделили Его три мировые религии единобожия – иудаизм, христианство и ислам?Какое влияние оказали эти три религии друг на друга?Известный историк религии, англичанка Карен Армстронг наделена редкостными достоинствами: завидной ученостью и блистательным даром говорить просто о сложном. Она сотворила настоящее чудо: охватила в одной книге всю историю единобожия – от Авраама до наших дней, от античной философии, средневекового мистицизма, духовных исканий Возрождения и Реформации вплоть до скептицизма современной эпохи.3-е издание.

Карен Армстронг

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература