Читаем Звуки и знаки полностью

Роджет ничего не знал и, разумеется, не мог знать, каких результатов достигнут науки, занимающиеся проблемой смысла, но он интуитивно понял основные принципы составления тезаурусов: сначала собираются слова из текстов или различных словарей. Затем слова эти выстраиваются по алфавиту, а после из них образуются определение группы, связанные по смыслу.

Какой может быть эта смысловая связь? Во-первых, одно и то же значение можно выразить с помощью разных слов или оборотов. Вполне понятно, что все синонимы будут объединены. Во-вторых, смыслы слов могут быть полностью противоположны (как антонимы типа холодный — горячий, мертвый — живой и т. п.) В-третьих, смысл одного слова может включать в себя смысл другого, или даже многих слов, например значение слова человек включает в себя наименования сотен различных национальностей нашей планеты. Смысловые связи между словами могут строиться по типу причина — следствие или часть — целое. Наконец значения слов между собой связаны самыми различными ассоциациями. Причем именно проблема ассоциаций является наиболее трудно разрешимой задачей при построении того или иного тезауруса.

Специалистам в данной области науки нетрудно выделить термины, которыми эта наука пользуется. Сложнее построить иерархию из слов-терминов по смыслу. Однако и эта задача разрешима логическим путем. Можно разграничить смысл слов и словосочетаний, которые образуют новые значения. Например, термины скорость бурения и бурение скоростное — это не синонимы, они имеют совершенно разные значения, так же как дюнный песок и песчаная дюна. Но специалисты по информатике с успехом ликвидируют подобного рода случаи (в первом случае бурение является аспектом, а во втором — атрибутом; в сочетании песчаная дюна песок — вещественная составляющая, а в сочетании дюнный песок — причина образования дюны).

С ассоциациями дело обстоит много сложней. Ибо здесь действуют законы не двузначной, а многозначной логики.

В тезаурусах группируются, например, понятия ранение — несчастные случаи — диагноз — медицина патология — терапия или чернила — краски — печатание — письмо. Интуитивно нам понятно, что объединение этих слов оправдано. Но попробуйте-ка доказать его путем формальной логики, и вы убедитесь, что это далеко не так просто, как на первый взгляд кажется. А ведь такие связи существуют не только между обычными словами языка, но и научными терминами.

Еще в 1942 году американский исследователь А. Л. Болдуин попытался внести количественные меры в изучение смысловых связей между словами. Он подсчитал совместную встречаемость слов в письмах, написанных одной женщиной, и показал, что частоты их могут быть указателями настроений этой женщины, круга ее интересов и т. п. С тех пор предложено несколько десятков формул, по которым можно вычислять смысловые связи слов.

Применяются для выявления этих связей и электронные вычислительные машины.

Конечно, как замечает один из специалистов по информатике — Р. М. Нидхем, «нельзя ожидать, что в результате нескольких часов работы ЭВМ. будет получено нечто, что могло бы сразу же заменить интуицию и труд ученого (который все равно необходим при выборе единиц анализа и интерпретации результатов). На что мы можем надеяться — так это на то, что выявятся группы слов, ранее не замеченные, но потенциально возможные».

Тезаурусы составляются учеными в «союзе» с машиной.

Сначала группа специалистов подчеркивает термины в данной области знания. Затем тексты вводятся в ЭВМ, которая выдает эти слова в исходной форме, то есть в именительном падеже, единственном числе и т. п. Потом специалисты разбивают на участки смысловое «поле», внутри этих участков производят более мелкое деление, а полученную схему оформляют в виде анкеты.

Анкета заполняется специалистами по каждому термину, а затем она поступает в ЭВМ, которая объединяет все термины, имеющие одинаковые признаки. И, наконец, человек составляет из них тезаурус.

Семантические множители

Нельзя ли использовать тезаурусы в качестве языка-посредника при машинном переводе? Этой мыслью задались английские ученые Кембриджской лингвистической группы.

В 1959 году один из крупнейших авторитетов в области машинного перевода, Бар-Хиллел, заявил, что высококачественный перевод с помощью ЭВМ принципиально невозможен. Ибо в нашем языке есть такая многозначность слов, которую нельзя ликвидировать, не обращаясь к внешнему миру, к внеязыковой, или, как говорят ученые, экстралингвистической ситуации, машине недоступной. Бар-Хиллел привел образец подобного рода принципиально непереводимой фразы… И в том же году сотрудники Кембриджской группы добились правильного машинного перевода этой фразы!

Перейти на страницу:

Все книги серии Библиотека «Знание»

Похожие книги

Письмо на английском языке: примеры, как писать (личное, деловое, резюме, готовые письма как образец)
Письмо на английском языке: примеры, как писать (личное, деловое, резюме, готовые письма как образец)

Как писать письмо на английском языке? Пособие представляет собой собрание образцов писем на английском языке, затрагивающих самые разнообразные стороны повседневной жизни. Это дружеские и деловые письма, письма – приглашения в гости и письма-благодарности, письма-извинения и письма-просьбы.Книга знакомит с этикетом написания письма на английском языке, некоторыми правилами английской пунктуации и орфографии, а также содержит справочные материалы, необходимые при написании писем.Пособие рассчитано на широкий круг лиц, владеющих английским языком в той или иной степени и стремящихся поддерживать письменные контакты с представителями англоязычных стран. Может использоваться как учебник английского языка, репетитор английского.Книга основана на ускоренных методах изучения иностранных языков.

Денис Александрович Шевчук

Языкознание, иностранные языки / Иностранные языки / Образование и наука
Английский язык с Робинзоном Крузо (в пересказе для детей) (ASCII-IPA)
Английский язык с Робинзоном Крузо (в пересказе для детей) (ASCII-IPA)

Английский язык с Робинзоном Крузо (в пересказе для детей)Robinson Crusoe Written Anew for Children by James BaldwinНеобыкновенно простой язык. C этой книги хорошо начинать читать по-английски.Текст адаптирован (без упрощения текста оригинала) по методу Ильи Франка: текст разбит на небольшие отрывки, каждый и который повторяется дважды: сначала идет английский текст с «подсказками» — с вкрапленным в него дословным русским переводом и лексико-грамматическим комментарием (то есть адаптированный), а затем — тот же текст, но уже неадаптированный, без подсказок.Начинающие осваивать английский язык могут при этом читать сначала отрывок текста с подсказками, а затем тот же отрывок — без подсказок. Вы как бы учитесь плавать: сначала плывете с доской, потом без доски. Совершенствующие свой английский могут поступать наоборот: читать текст без подсказок, по мере необходимости подглядывая в подсказки.Запоминание слов и выражений происходит при этом за счет их повторяемости, без зубрежки.Кроме того, читатель привыкает к логике английского языка, начинает его «чувствовать».Этот метод избавляет вас от стресса первого этапа освоения языка — от механического поиска каждого слова в словаре и от бесплодного гадания, что же все-таки значит фраза, все слова из которой вы уже нашли.Пособие способствует эффективному освоению языка, может служить дополнением к учебникам по грамматике или к основным занятиям. Предназначено для студентов, для изучающих английский язык самостоятельно, а также для всех интересующихся английской культурой.Мультиязыковой проект Ильи Франка: www.franklang.ruОт редактора fb2. Есть два способа оформления транскрипции: UTF-LATIN и ASCII-IPA. Для корректного отображения UTF-LATIN необходимы полноценные юникодные шрифты, например, DejaVu или Arial Unicode MS. Если по каким либо причинам вас это не устраивает, то воспользуйтесь ASCII-IPA версией той же самой книги (отличается только кодированием транскрипции). Но это сопряженно с небольшими трудностями восприятия на начальном этапе. Более подробно об ASCII-IPA читайте в Интернете:http://alt-usage-english.org/ipa/ascii_ipa_combined.shtmlhttp://en.wikipedia.org/wiki/Kirshenbaum

Джеймс Болдуин , Илья Михайлович Франк

Языкознание, иностранные языки