Кроме того, соответствие слов разных языков друг другу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка В и наоборот. Следовательно, в переводящем автомате необходимо предусмотреть программу выбора правильного эквивалента.
Такие программы обычно основываются на двух принципах:
1. На принципе выбора эквивалента по синтаксической модели входного текста, чаще всего по синтаксической модели предложения. Таким образом, например, автомат может различить эквиваленты глагола "to book" и существительного "book" (соответственно, "резервировать" и "книга").
2. На принципе выбора эквивалента по семантической модели. По разным семантическим моделям автомат, например, может различать такие эквиваленты слова "solution" как "решение" и "раствор". Обе модели обычно применяют в комплексе. И сами модели, и процедуры выбора эквивалентов довольно сложны. Мы кратко и в общих чертах рассмотрим их ниже.
В некоторых более сложных системах в дополнение к этим двум принципам выбора эквивалента применяют также и принцип выбора на основе внелингвистической (фоновой) информации. Модели для выбора эквивалентов, работающие по этому принципу, еще сложнее: их относят к разряду моделей искусственного интеллекта.
В зависимости от сложности выбора правильного зна-
чения слов и, соответственно, правильного переводного эквивалента модели и системы машинного перевода можно разделить на три уровня.
Наконец,
Для того чтобы яснее представить себе возможности систем разного уровня и качество перевода, которое вы можете получить с их помощью, давайте проведем аналогию между действиями автомата и человека.
Система действует так же, как действуем в этом случае мы. Берет первое слово, смотрит, есть ли оно в словаре в таком виде. Если есть, выписывает все его переводы, если нет, то ищет в таблице словоизменения форму слова, обнаруженную в тексте, определяет соответствующую словарную форму и выписывает все переводы. Затем берет следующее слово и т.д.
В данном случае отличие от перевода, выполняемого человеком, состоит в том, что человек, делая такой перевод, отбрасывает все неподходящие переводные эквиваленты, система же машинного перевода низшего уровня этого не делает. Вот какой, например, получается перевод короткого предложения: Lead absorbs radiation
свинец / лот / грузило / вести / руководить / лидировать / руководство / лидерство / проводник; всасывать / впитывать абсорбировать / амортизировать / поглощать; излучение/ радиация',
Но так же, как переводчик, который совершенно не понимает содержания переводимого текста, переводящий