Читаем Профессия: переводчик полностью

свинец (лот / грузило / проводник) всасывает (впиты­вает / абсорбирует / амортизирует / поглощает) излуче­ние (радиацию) или

излучение (радиация) впитывается (абсорбируется / амортизируется / поглощается) свинцом (лотом / гру­зилом / проводником).

Так в общих чертах работает переводящий автомат второго уровня, построенный по схеме синтактико-семан-тического трансфера. Такой автомат строится для опреде­ленной пары языков и, как вы сами можете судить, ис­пользует алгоритмические процедуры анализа и синтеза на основе синтаксической и семантической информации.

Как уже говорилось, большинство коммерческих пере­водящих систем работает на этом принципе. В некоторых из них синтактико-семантическая информация более пол­ная и алгоритмы анализа более тонкие, чем в других. Такие "электронные переводчики" переводят чуть лучше, чем их более примитивно устроенные "братья по классу", но в лю­бом случае без привлечения фоновой информации они не в состоянии конкурировать с человеком.

Кроме схемы трансфера в переводящих системах второ­го уровня применяется также так называемый язык-посредник. Язык-посредник (interlingua, pivot language) -это некий универсальный код, с помощью которого мож­но единым образом выразить грамматическую и семанти­ческую информацию, содержащуюся в тексте на любом языке.

Задача переводящего автомата, применяющего язык-посредник, будет состоять в том, чтобы преобразовать текст на одном языке в форму языка-посредника, а затем, используя средства другого языка, генерировать выходной текст из форматов языка-посредника.

Привлекательность этой идеи достаточно очевидна, но ее практическое воплощение оказалось очень непростым. И хотя некоторые зарубежные системы в своих рекламных буклетах пишут об использовании единого языка-посредника для автоматического перевода с разных язы­ков, это, насколько мне известно, скорее рекламный при­ем, чем действительное положение вещей.

Описать в едином формате даже структурно подобные языки достаточно сложная задача сама по себе, не говоря уже о ее алгоритмической реализации. Поэтому в настоя­щее время, несмотря на обширный теоретический матери­ал, едва ли можно говорить о коммерческих системах ма­шинного перевода, работающих на принципе языка-посредника.

Такова ситуация с практической реализацией систем второго уровня.

Что же касается систем третьего уровня, то, как уже го­ворилось выше, экспериментальные системы такого типы разработаны лишь для некоторых очень ограниченных тематических сфер.

В этих системах окончательное решение о выборе пере­водного эквивалента принимается "блоком принятия ре­шений" на основе так называемой базы знаний - формаль­ного описания фрагмента реального мира (его составляю­щих и отношений между ними). Сложность концептуаль­ной и программной реализации таких систем, я думаю, очевидна.

Особое место в теории и практике машинного перевода занимают системы, основанные на статистических моделях переводных соответствий.

Согласно статистическому подходу к конструированию систем автоматического перевода, любое слово одного языка может быть переведено любым словом другого, только с разной вероятностью.

Задача переводящего автомата, работающего на веро­ятностном принципе достаточно проста.

На первом этапе, называемом этапом обучения, этот

автомат должен сравнивать оригинальные тексты и вы­полненные человеком переводы этих текстов и регистри­ровать величины вероятности разных переводных эквива­лентов.

Параллельно на этапе обучения автомата в зависимости от используемой модели регистрируется либо порядок слов в исходном и переводном предложении, либо вероят­ность перевода двух-, трехсловных словосочетаний.

В итоге на основании анализа параллельных двуязыч­ных текстов автомат после этапа обучения составляет сло­варь наиболее вероятных эквивалентов.

После этого следует этап перевода, когда автомат, поль­зуясь составленным таким образом вероятностным слова­рем, переводит новый текст. В случае неполноты словаря обучение автомата продолжают на новом массиве парал­лельных текстов.

Такова общая идея. Конечно, она представлена упро­щенно - в действительности вычисление вероятности пе­реводных эквивалентов производится по сложным много­параметрическим формулам, учитывающим текстовое ок­ружение исходного и переводного слова.

Идея статистического машинного перевода появилась еще в пятидесятые годы, но сейчас она снова становится популярной. Возрождение идеи статистического машин­ного перевода можно объяснить следующим:

• Огромными технологическими возможностями со­временных компьютеров (память, быстродействие).

• Наличием больших объемов двуязычных параллель­ных текстов на машинных носителях.

• Отсутствием стройной и непротиворечивой теории перевода, которая смогла бы выдержать проверку на компьютерной модели.

Статистические модели перевода активно разрабатыва­ются в США и в некоторых других странах, и, на мой взгляд, у них большое будущее.

Учитывая огромное число факторов, определяющих качество перевода (значительная часть которых либо не

Перейти на страницу:

Похожие книги

Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта

Эта книга — захватывающая история нашей способности говорить. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, крупным планом демонстрирует базовые механизмы речи, подробно рассматривает, как голос определяет личность и выдает ее особенности. Книга переносит нас в прошлое, к истокам человеческого рода, задавая важные вопросы о том, что может угрожать нашей уникальности в будущем. В этом познавательном путешествии мы встретимся со специалистами по вокалу, звукооператорами, нейробиологами и компьютерными программистами, чей опыт и научные исследования дадут более глубокое понимание того, что мы обычно принимаем как должное.

Тревор Кокс

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Исторические приключения