Компания Beyond Verbal использует методики глубинного обучения и распознавания образов, чтобы выделить из колебательных сигналов голоса эмоциональную составляющую. Сам по себе человеческий голос эволюционировал не для того, чтобы передавать эмоции, но именно психология человека определяет и задает интонацию в речи. Руководитель научного отдела компании доктор Йорам Леванон в беседе о том, как эмоции обретают голосовое выражение, отмечает, что соматические изменения, сопровождающие переживание эмоций, изменяют свойства речи. В какой-то мере это схоже с идеей Манфреда Клайнса о том, что эмоции можно обнаружить по колебательным сигналам от нажатия пальцев. По словам доктора Леванона, мы учимся определять эти эмоциональные характеристики голоса на ранних этапах своего развития, начиная с внутриутробного периода. Предположительно, во время раннего обучения происходит самоорганизация соответствующих нейронов, в результате которой мы обретаем способность распознавать эмоции в голосе людей10.
Beyond Verbal предлагает интерфейс программирования приложений (API) и набор средств разработки (SDK), позволяющие разработчикам встроить в собственные приложения функцию анализа эмоций по интонациям голоса. Они также запустили технологию Moodies, которая позиционируется как первое в мире приложение обработки и анализа данных для смартфонов. В Beyond Verbal утверждают, что оно может оценивать результат на основе более чем четырехсот эмоциональных вариантов, определяющих широкий спектр чувств и настроений. Генеральный директор компании Юваль Мор прогнозирует, что вскоре приложения для обработки и анализа голосовых данных станут частью каждого устройства или платформы с голосовой активацией.
Десятки компаний стремятся занять свою нишу в сфере технологий распознавания голоса. Одни разрабатывают собственные продукты с нуля, другие пользуются интерфейсами программирования и наборами средств для разработки приложений от сторонних производителей.
Кроме Affectiva и Emotient, в сфере распознавания выражений лица работают такие компании, как Eyeris, IMRSV, Noldus, RealEyes, Sightcorp, и Affective Computing Company (tACC).
Даже Microsoft запустила когнитивные сервисы, предложив API-интерфейс Emotion, предоставляющий естественные и контекстные интерактивные инструменты для улучшения взаимодействия с пользователем. Сейчас интерфейс ориентирован в основном на распознавание выражений лиц.
В других областях распознавания эмоций работает компания Emospeech, которая, как и Beyond Verbal, разрабатывает приложения для определения эмоций в речи. Nemesysco, еще одна израильская компания, занимается анализом уровня стресса говорящего с целью выявления мошенничества. Шведская компания Tobii's business ориентируется на контроль взгляда и движений глаз при изучении человеческого поведения. Анализ походки и поз также считается предметом исследования эмоционального программирования и находит применение в таких областях, как физиотерапия и эргономика. Однако пока еще сложно использовать согласованные признаки эмоциональных состояний для фиксирования той или иной эмоции. Возможно, когда технология геолокации достигнет определенного разрешения или с портативных камер можно будет получать обратную связь о передвижениях владельца, анализ общих признаков сможет продвинуться вперед.
Обратная сторона эмоционального программирования – синтез эмоций для программного обеспечения и роботизированных систем. Некоторые компании начали заполнять этот сегмент рынка и обучать машины создавать видимость эмоций. Например, компания Emoshape, с представительствами в Лондоне и Нью-Йорке производит эмоциональный процессор, который можно встраивать в устройства, создавая у пользователя впечатление, что устройство переживает эмоции11. Эмоциональный процессор позиционируется как первый эмоциональный чип для ИИ, роботов и электронных устройств широкого потребления. Он подключается к сенсорам, определяющим эмоции пользователя, а затем воспроизводит эту информацию в своем поведении. Отслеживая выражения лица, используемые слова и тона голоса пользователя, устройство может оценивать уровень его эмоций.
Другие компании неизменно последуют их примеру, либо создавая собственные специализированные эмоциональные процессоры, как Emoshape, либо разрабатывая и продавая собственные эмоциональные движки с API-интерфейсом, в которые можно встраивать другие приложения. С их помощью можно будет изменять поведение и действия роботов, программных приложений и персональных ИИ-помощников, подобных Мэнди (персональному цифровому помощнику из главы 1).
Александр Александрович Воронин , Александр Григорьевич Воронин , Андрей Юрьевич Низовский , Марьяна Вадимовна Скуратовская , Николай Николаевич Николаев , Сергей Юрьевич Нечаев
Культурология / Альтернативные науки и научные теории / История / Эзотерика, эзотерическая литература / Образование и наука