В тезаурусах преодолевается один из весьма существенных недостатков традиционных словарей. Ведущий отечественный специалист по прикладной лингвистике А.И. Новиков полно охарактеризовал этот недостаток в предисловии к монографии «Семантика информационных технологий» Ю. Филипповича и А. Прохорова: «Традиционный словарный способ представления лексики характеризуется тем, что слова в нем организуются на основе какого-либо формального принципа (например, алфавитное расположение). Вследствие этого и значения, которые задаются в таких словарях в виде дефиниций, также оказываются разобщенными и в явном виде не обнаруживают своей системности. Ее можно установить в результате специальной деятельности, заключающейся в обнаружении некоторых общих компонентов в этих значениях, или других признаках их связности. Иногда сделать это бывает достаточно трудно. Это дает основания считать, что традиционный словарь, являясь инструментом представления лексического состава языка, как правило, не отражает достаточно полно и эксплицитно внутреннюю системность языка. Он может служить материалом для такой системности, для чего требуется специальная деятельность лингвиста и соответствующие методы анализа» (Филиппович, Прохоров 2002: 5–6). Естественно, рядовой носитель языка, а тем более школьник, не владеет специальными методами анализа и не сможет на основе традиционных словарей составить представление о предметной области, выявить меру различия близких понятий и т. п. Эти задачи позволит ему решить тезаурус.
Некоторые полезные тезаурусы представлены в Интернете по адресу http://www.rutenia.ru/folklore/. С содержанием лингвистических понятий можно ознакомиться в «Тезаурусе по теоретической и прикладной лингвистике» С.Е. Никитиной (Никитина 1978). Опыт словарно-тезаурусного описания семантики информационных технологий обсуждается в монографии Ю.Н. Филипповича и А.В. Прохорова (Филиппович, Прохоров 2002).
Задание 1.
Найдите определение термина тезаурус в сетевых энциклопедиях Википедия и Кругосвет. Сохраните скриншоты с определениями для итоговой презентации по спецкурсу.Задание 2.
Ознакомьтесь с тезаурусами, доступными по адресу http://www.rutenia.ru/folklore/.База данных
не является понятием собственно прикладной лингвистики. Это понятие общее для всех информационных технологий. База данных – это структурированная совокупность взаимосвязанных данных в рамках некоторой предметной области, предназначенная для длительного хранения во внешней (не оперативной) памяти компьютера и постоянного применения. Тем не менее создание базы данных – ключевая технология компьютерной лексикографии. Современные словари создаются на основе хранимых в памяти компьютера контекстов, для их создания используют программы, позволяющие формальным образом представить морфологические, словообразовательные, синтаксические и даже семантические характеристики слова.Формирование базы данных начинается с табличного представления сырого материала. В стандартный пакет программного обеспечения Windows входят электронные таблицы Excel, позволяющие организовать материал и производить стандартную статистическую обработку. Однако управлять базой данных в Excel неудобно. Для управления базой данных Microsoft Office предлагает систему управления базой данных Access (СУБД Access). Это сравнительно простая система, позволяющая из исходного материала, введенного в базу данных, формировать множество таблиц по количественным и качественным параметрам, заданным самим пользователем. СУБД Аccess широко используется в лингвистических работах.
Задание 1.
Ознакомьтесь с приложением Excel. Используя возможности приложения, попытайтесь составить таблицу образцов склонения русских существительных.Задание 2.
Выберите одну из доступных в Интернет лингвистическую базу данных:http://www.speech.nw.ru/,
http://www.imli.ru/zagovor/,
www.lingsoft.fi/doc/rustwol.txt.
Подготовьте презентацию о ней.
(Индивидуально) Выбрать одну из доступных в Интернете лингвистическую базу данных: http://www.speech.nw.ru/, www.imli.ru/zagovor/, www.lingsoft.fi/doc/rustwol.txt. Подготовьте презентацию о ней.
Составить таблицу формообразования (по выбору) в Excel.
Четвертый урок
Тема: Основные ИКТ прикладной русистики: корпус данных и корпус текстов
Цель в предметной области:
знакомство с Национальным корпусом русского языка и другими корпусами, систематизация знаний о лексическом значении слова.Цель в формировании информационно-коммуникационной компетентности:
знакомство с технологией национальных корпусов.Задачи:
1. Установить основные отличия корпуса данных от базы данных.
2. Определить цели создания национальных корпусов.
3. Определить достоинства представления национального языка в виде корпуса.
А. А. Писарев , А. В. Меликсетов , Александр Андреевич Писарев , Арлен Ваагович Меликсетов , З. Г. Лапина , Зинаида Григорьевна Лапина , Л. Васильев , Леонид Сергеевич Васильев , Чарлз Патрик Фицджералд
Культурология / История / Научная литература / Педагогика / Прочая научная литература / Образование и наука