Цель идентификации по образцу речи – убедиться, что говорящий является именно тем, за кого себя выдает, либо идентифицировать незнакомого человека. Идентификация по образцу речи тесно связана с биометрическими технологиями, предназначенными для идентификации людей по их уникальным физическим признакам, таким как отпечатки пальцев или рисунок радужной оболочки глаза. Эти технологии используются в криминалистике и в системах безопасности.
Технология синтеза речи обеспечивает преобразование любого хранимого в компьютерном формате текста в синтетическую речь, звучащую приблизительно как человеческая. Речевой вывод используется на компьютерах уже в течение некоторого времени. Однако «репертуар» первых систем был сильно ограничен. Сегодня имеется широкий выбор синтезаторов речи, большинство из которых укомплектовано собственным текстовым процессором. В основном синтезаторы говорят на американском английском, но некоторые на других языках, в том числе и русском. Иногда можно выбирать и голос: нормальный мужской, нормальный женский, басовитый мужской, хриплый женский и т. д.
И при распознавании, и при синтезе речи основная опора при анализе идет на акустическую картину звука. В связи с этим современному учителю русского языка необходимы представления об акустической структуре звука и о возможностях работы со звуковыми базами данных.
Современные компьютерные программы, позволяющие производить акустический анализ звучащей речи, многочисленны. Каждая из них имеет свои особенности и предназначена для определенного типа задач. Рассмотрим одну из самых простых.
Программа Goldwave – это звуковой редактор, который позволяет проигрывать, записывать и преобразовывать звуки. С помощью этой программы можно создавать звуковые файлы для web-сайтов, автоответчиков, системные звуки Windows. Программа позволяет вырезать часть звукового файла, измерять спектральные и временные характеристики звука, менять параметры частоты и амплитуды, накладывать на запись звуковые эффекты и т. д., при этом вы можете работать одновременно с несколькими звуковыми файлами. Goldwave написана под Windows, и владение другими приложениями Windows существенно облегчит использование программы. Goldwave поддерживает целый ряд надежных звуковых форматов (.wav, voc, mp3, au, aif, iff, snd, smp, vox и др.). Программа снабжена удобной справкой (правда, на английском языке). Интерфейс также англоязычный. На сайте разработчика Goldwave www.goldwave.com можно найти демонстрационную версию программы.
Как уже говорилось выше, интерфейс программы англоязычный. Ниже дан перевод команд основного меню в той последовательности, как они представлены в программе (количество и состав команд могут отличаться в разных версиях программы. Первая строка: File (файл), Edit (правка), Effects (эффекты), View (вид), Tools (инструменты), Options (сервис), Window (оюго), Help (справка). Если вы хотите получить информацию о возможностях программы или о ее использовании, нажмите Help (меню справки частично русифицировано).
• Вторая строка: New (новый), Open (открыть), Save (сохранить), Undo (отменить), Copy (копировать), Past
(вставить), P.New (вставить новое), Mix (совместить), Repl (заменить), Del (удалить), Trim (обрезать), Sel Vw (выделить), Sel All (выделить все), Set (установить), All (показать общий вид), Sel (показать выделенное), Prev (предыдущий масштаб), In (увеличить), Out (уменьшить), 1:1 (в масштабе 1:1), Cues (ключевые точки), Eval (параметры сигнала), CDX (компакт-диск), Chain (цепь эффектов), Help (справка). Последняя клавиша дублирует клавишу Help первой строки.
• Третья строка содержит ряд символов, обозначающих эффекты: допплер, динамики, эхо, сжатие/растяжение, преобразовать, интерполяция, инвертировать, модуляция, офсет, частота, реверберация, реверс, эквалайзер, фильтры, частотные фильтры, параметрический эквалайзер, уменьшение шума, поп/клик, удаление тишины, сглаживание, громкость, постепенное увеличение громкости, постепенное уменьшение громкости, совместить, максимальная громкость, форма, баланс, скорость воспроизведения (без пересчета частот), скорость воспроизведения (с пересчетом частот), микшер каналов, максимальное соответствие, понижение громкости голоса, время звучания.
• Четвертая строка объединяет клавиши управления звуком (кнопки магнитофона): играть зеленую, играть желтую, стоп, назад, вперед, пауза, запись, остановить запись, установки.
Все команды снабжены выходом в справку непосредственно из команды.
Для примера был выбран коротенький фрагмент из звуковой хрестоматии «Городские социолекты: Пермская городская речь» (Ерофеева Т.И. и др. 2000) – слово «мясо» в произнесении информанта № 23 (мужчина, место рождения – Пермская область, образование среднее, 52 года) из фразы
А. А. Писарев , А. В. Меликсетов , Александр Андреевич Писарев , Арлен Ваагович Меликсетов , З. Г. Лапина , Зинаида Григорьевна Лапина , Л. Васильев , Леонид Сергеевич Васильев , Чарлз Патрик Фицджералд
Культурология / История / Научная литература / Педагогика / Прочая научная литература / Образование и наука