Кроме того, широко применяется
Перечисленные способы отличаются еще по одному параметру: поиск только с помощью дескрипторов, как правило, очень точно выделяет нужные документы, хотя некоторые из них могут не попасть в выборку из-за недостатков систематизации или предметизации. Правильно сформулированный контекстный поиск даст все нужные документы – но, к сожалению, и большое количество ненужных (велик «информационный шум»).
Для изменения результатов поиска (расширения или сужения) могут применяться специальные операторы:
• замены символа: (одного) или * (нескольких);
• усечения слова (слева, справа);
• больше, меньше, равно;
• операторы буквального соответствия;
• операторы диапазона значений;
• логические операторы: И (и то и это), ИЛИ (или то, или это, или оба вместе), НЕ, исключительное ИЛИ (или только то – или только это);
• операторы близости расположения и порядка следования слов.
Может задаваться старшинство операторов (как в алгебраических выражениях, с помощью скобок).
Развитые системы поиска и базы данных позволяют сохранять результаты поисков и не только производить логические операции над выражениями, но и комбинировать с помощью логических операторов результаты предыдущих поисков, уточняя и дополняя запрос сколь угодно долго, вплоть до получения удовлетворительного результата.
Об информационно-поисковых языках
Поиск информации в некоторой системе и ее ввод в систему – две стороны одной медали. При вводе информации (создании справочника, каталога, ведении базы данных, сайта в Сети, упорядочивании массива документов по каким-либо правилам) всегда имеют в виду особенности организации поиска в этой системе, применяемый информационно-поисковый язык, для чего и приспосабливают ее структуру, организуют справочный аппарат, ссылки в Сети. При поиске информации всегда нужно иметь в виду, каким образом она попадает в систему, чем при этом руководствуются, как организована конкретная запись, как информацию предметизируют, систематизируют, индексируют.
Как происходит присвоение дескрипторов документу (предметизация или систематизация)? Имеется набор правил предметизации документов, которые применяются в библиотеках, существуют также списки предметных рубрик, в которые со временем вносятся изменения. Все это может применяться в работе журналиста. Имеются также два набора таблиц систематизации – ББК (Библиотечно-библиографическая классификация) и УДК (Универсальная десятичная классификация). Они опубликованы в краткой и полной форме и легкодоступны. Во многих случаях (указателях, базах данных и т. п.) применяются нестандартные схемы предметизации или, реже, систематизации, «заточенные» под конкретную задачу. Никто не мешает журналисту взять готовую систему и внести в нее необходимые изменения и уточнения. Нужно, однако, иметь в виду, что, чем бoльшие изменения будут внесены в стандартную общепринятую схему, тем бoльшие трудности могут возникнуть при попытке обмена информацией и при использовании системы сторонними лицами.
В сети Интернет также применяются особые правила присвоения дополнительных поисковых терминов электронным документам. Отчасти они определяются языком гипертекстовой разметки документов, отчасти – традицией и этикетом, а кроме того – требованиями, которые предъявляют конкретные поисковые машины к оформлению индексируемых ими документов.
Примеры индексирования документов в конкретной и биографической базе данных
При индексировании документов используется два вида информационно-поискового языка: классификационные индексы и ключевые слова. При формировании базы данных индексирование осуществляется de visu – по полному тексту исходного документа. Такой метод позволяет с помощью набора ключевых слов более полно и адекватно отразить содержание индексируемого документа, а набор ключевых слов по сути может выступать как вспомогательная аннотация документа. Например:
Ключевыми словами здесь будут: