Читаем Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта полностью

Убийца с Грин-Ривер получил свое прозвище по названию реки к югу от Сиэтла, на берегу которой он в 1980-х и 1990-х годах оставлял тела своих жертв. Одним из инструментов, которым пользовалась полиция во время охоты на серийных убийц, был полиграф. Эта машина проверяет, говорит ли человек правду, опираясь на физиологические признаки, такие как скорость биения сердца, потоотделение и дыхание. В 1984 году Гэри Риджуэй, женатый человек, работавший в окрасочном цехе, добровольно вызвался пройти испытание на полиграфе и успешно его прошел. Девятнадцать лет спустя Риджуэя посадили за решетку за 48 жестоких убийств первой степени, после того как результаты теста ДНК неопровержимо доказали его связь с жертвами этих убийств [1]. Понятно, что полиграф не смог идентифицировать убийцу с Грин-Ривер.

Проверка на детекторе лжи на Клинтонском инженерном заводе, 1944

Научное исследование полиграфа, предпринятое Британским психологическим обществом, показало, что в уголовных делах правильность результатов теста составляет от 83 до 89 %, если он проверяет действительно виновных людей. Но если тест проходит невиновный человек, то правильность результатов составляет от 53 до 78 % от общего числа тестов [2]. Несмотря на это, в 2014 году британское правительство ввело обязательную проверку на полиграфе опасных преступников, совершивших сексуальные преступления. Судебные разбирательства показали, что проверка на полиграфе заставляла таких преступников с большей вероятностью признаваться в рискованном поведении, например рассматривании порнографических изображений или знакомстве с детьми. Но на самом деле эти признания не были получены на полиграфе: преступники признавались сами, потому что верили в возможности аппарата разоблачать ложь.

Но если полиграф недостаточно надежен, возможно, мы сможем научить компьютер анализировать речь? Анализ стресса по голосу – это сомнительный метод, используемый страховыми фирмами, полицией и правительственными департаментами для выявления у людей признаков лжи. ABC News утверждает, что этот метод использовался в заливе Гуантанамо и в Ираке, после чего был запрещен Пентагоном [3]. Компании, которые продают такие системы, не раскрывают секретов их работы, но научные исследования подвергли сомнению их эффективность. Напротив, существуют стандартные способы использования компьютера для восприятия голоса и его последующей интерпретации, и эти способы подробно описаны. Основные подходы уже используются в различных ситуациях – например, автомобиль по затрудненной речи определяет, что водитель пьян, или мобильное приложение предупреждает людей с биполярным расстройством об изменении настроения.

Научить компьютер слушать и понимать речь можно с помощью машинного обучения, когда компьютерную программу учат анализировать запись и извлекать из нее полезную информацию. Некоторые важные вычисления в науке о речи основаны на простых математических формулировках. Если вы хотите узнать, с какой частотой открываются и закрываются голосовые связки, существуют специальные уравнения для получения этой информации по форме звуковой волны. Но если вы хотите узнать о чем-то менее определенном, например не тревожится ли человек о чем-то, то маловероятно, что математические рассуждения принесут результат. В таких случаях компьютерная программа должна на собственном опыте «научиться» опознавать явные признаки тревоги.

Машинное обучение в случае с аудиозаписями может использоваться не только для распознавания речи. Оно применяется при анализе музыки, например для определения жанра – является ли произведение классическим, джазовым, представляет рок-музыку и т. д. В корпорации BBC R&D я занимался исследованием эмоций, которые вызывают музыкальные заставки теле- и радиопрограмм. В архивах BBC хранятся миллионы записей, и корпорация хотела, чтобы каждой из них была присвоена метка с указанием настроения (веселая ли запись, печальная или, наоборот, заряжает энергией), чтобы можно было легко сориентироваться в архиве, отыскивая записи с определенным настроением. Может ли в этом помочь анализ музыкальной заставки? Когда звучат первые радостные аккорды музыкальной заставки к американскому ситкому «Друзья», вы можете догадаться, что это оптимистическая комедия, даже если никогда не смотрели этот сериал. Многие новостные сводки начинаются торжественно, чтобы настроить на серьезный лад. Мы хотели узнать, сможет ли компьютер определять характер музыкальной темы: радостная она или грустная, забавная или серьезная?

Перейти на страницу:

Похожие книги

Древний Египет
Древний Египет

Прикосновение к тайне, попытка разгадать неизведанное, увидеть и понять то, что не дано другим… Это всегда интересно, это захватывает дух и заставляет учащенно биться сердце. Особенно если тайна касается древнейшей цивилизации, коей и является Древний Египет. Откуда египтяне черпали свои поразительные знания и умения, некоторые из которых даже сейчас остаются недоступными? Как и зачем они строили свои знаменитые пирамиды? Что таит в себе таинственная полуулыбка Большого сфинкса и неужели наш мир обречен на гибель, если его загадка будет разгадана? Действительно ли всех, кто посягнул на тайну пирамиды Тутанхамона, будет преследовать неумолимое «проклятие фараонов»? Об этих и других знаменитых тайнах и загадках древнеегипетской цивилизации, о версиях, предположениях и реальных фактах, читатель узнает из этой книги.

Борис Александрович Тураев , Борис Георгиевич Деревенский , Елена Качур , Мария Павловна Згурская , Энтони Холмс

Культурология / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / История / Детская познавательная и развивающая литература / Словари, справочники / Образование и наука / Словари и Энциклопедии