Филологическая мысль и практика видят несколько путей работ, целесообразных с точки зрения использования современных информационных технологий в интересах гуманитарной практики. Среди них фольклористическое направление. В материалах конференции «Современная технология и филология» (Москва, ИЛИ РАН, 2005) приводятся конкретные примеры использования информационных технологий в деятельности собирателей и исследователей народного творчества: фольклорный архив Кабинета фольклора и теории литературы филфака СПбГУ [Веселова 2005]; электронная версия фольклорного архива Сыктывкарского государственного университета [Канева, Чаркова 2005]; электронное издание удмуртского фольклора на примере локальной традиции [Попова, Перевозчиков 2005];
система СКАЗКА как инструмент исследования волшебных сказок [Рафаева 2005]; мультимедийные технологии описания фольклорной и хозяйственно-бытовой традиции села [Серов 2005]. В материалах международной научной конференции «Типология фольклорной традиции: актуальные проблемы полевой фольклористики» (Москва, 22–23 ноября 1999 г.) есть специальный раздел «Компьютерная систематизация полевых записей и мультимедийные публикации».
Суть материалов этого раздела выражена в статье о проблемах компьютеризации фольклорных архивов [Мороз 2004]. Автор пишет о том, что большинство фольклорных, диалектологических и этнолингвистических архивов организовано по старинке, что позволяет использовать информацию не более чем на 30 %, поскольку записи в картотеках рассортированы по минимуму признаков; записи хранятся в папках или в аудиокассетах с краткой описью; классификация, сортировка и поиск возможны по одному параметру; доступ лиц, не причастных непосредственно к созданию архива, затруднителен; публикация материалов в значительном объёме затруднена; записи в одном селе дублируются разными экспедициями. Первые попытки применения компьютерной техники ориентируются на те же принципы, что и рукописные архивы. Автор формулирует принципы использования компьютера в создании фольклорных архивов: одновременный перекрёстный поиск по разным параметрам: соединение текстовых, аудио-, фото– и видеоматериалов в одном архиве; широкие возможности распространения (в том числе и через Интернет); создание единой информационной системы, объединяющей несколько архивов.
Информационные технологии можно классифицировать как
Начнём с вопроса, в какой реальной помощи со стороны информатики нуждается гуманитарий-исследователь? Ответ: в наличии электронного корпуса текстов и программном обеспечении, позволяющем быстро и точно представлять пользователю все необходимые языковые единицы в отвлечении от текста и в форме конкорданса. Информационная технология должна дать сведения о наличии требуемого элемента, его количестве (словоупотреблении) и функции в контексте. В итоге в руках исследователя должен оказаться своеобразный текстовый информационный комплекс: текст – программа – промежуточные вспомогательные материалы, полученные с помощью программы на базе привлечённого текста.
Как используются индивидуальные информационные системы, покажем на примере созданного нами информационного текстового комплекса «Конкорданс русской народной лирики».
Из семитомного свода А.И. Соболевского «Великорусские народные песни» (СПб., 1895–1902) (тома 2–6) были извлечены песенные тексты, записанные в XIX веке в Курской, Архангельской и Олонецкой губерниях. Также учитывались былинные тексты, записанные А.Ф. Гильфердингом от Т.Г. Рябинина. В итоге сформировались четыре корпуса текстов – «Курск», «Архангельск», «Олонец» и «Рябинин».
Тексты подверглись некоторой адаптации: были сняты все примечания и указания на место записи, сборник и год публикации, каждый текст получил паспорт – в ломаных скобках номер тома свода Соболевского / Гильфердинга и номер песни / былины в томе. В результате каждый корпус превратился в единый текст, похожий на гипертекст, под которым понимается некое информационное пространство, позволяющее разрушить формальную оболочку отдельного конкретного текста, в него помещённого, за счёт создания системы связей, служащих объединению этих отдельных текстов в сверхтекстовые единства [Дедова 2003: 106–107]. В нашем случае гипертекст – это корпус текстов, представленный одним файлом в текстовом формате с системой паспортизации.