выше, декомпозиция запроса и определение ключевых для поиска средств. При
этом необходим выбор поисковых сервисов и инструментов, отвечающих
специфике задачи и, что крайне важно, последовательности их применения в
зависимости от ожидаемой результативности.
Для решения проблемы поиска информации в Интернете существует
целый ряд поисковых систем. Их основная задача - давать ответы на вопросы
пользователей. Например, если мы «спросим» у поисковой системы, где в
виртуальном пространстве находится Российская Национальная библиотека, то
она в ответе укажет на ссылку (адрес в сети Интернет), воспользовавшись
которой мы окажемся на сервере библиотеки. Без поисковых систем пришлось
бы наугад перебирать адреса. Может быть, мы даже нашли бы когда-нибудь
нужный адрес
Поисковые системы можно условно разделить на два класса. Первый - это
автоматические роботы-индексаторы, т.е. в нашей терминологии - субъекты
КС, которые без участия человека постоянно сканируют информационное
пространство Интернета и индексируют (т.е. устанавливают связи между
понятиями и содержанием страниц) почти все, что им попадется. Результаты
своей работы они заносят в базу данных, из которой потом извлекается ответ на
запрос пользователя. Такие системы должны постоянно «передвигаться» по
Интернету: искать новые документы и обновлять старые. Для этого они
подключены к Сети через мощные каналы связи.
Второй класс - тематические каталоги, которые с самого начала были
созданы не для того, чтобы собрать под свою крышу абсолютно все. В
каталогах вся информация рассортирована по темам, причем в них содержится
информация, обработанная человеком. Это означает, что по каждому ресурсу
Интернета (страница, документ, сайт, сервер) составляется краткая справка:
содержание, ссылки на другие ресурсы, автор, фирма и т.п. Ценность
информации в каталогах значительно выше, чем в автоматических индексах,
но, к сожалению, ее и значительно меньше. Стоит заметить, что многие
каталоги не бесплатны, особенно это касается тех, которые содержат
коммерческую информацию. Вот несколько рекомендаций по практическому
нахождению информации с помощью поисковых систем:
• необходимо иметь в виду, что ответы на один и тот же вопрос в различных
поисковых системах не совпадают, поэтому для получения полного
ответа на свой вопрос надо провести поиск с помощью нескольких
поисковых систем;
• при первом ознакомлении с интересующей темой лучше всего начинать с
тематических каталогов.
найти что-то в Рунете (в доменной зоне имен «.га»), лучше всего начинать
поиск с российских поисковых систем, и в первую очередь - с поисковой
169
машины
помощью глобальной поисковой системы
Русская буква «Я» среди латинских в названии
пожелание авторов системы. В английском варианте название становится более
читаемым -
поисковая машина (слово «машина» - это также изыск авторов), которая
находится по адресу: http://www.yandex.ru.
Поисковая система
дизайн и расширяла сервисные функции, а в локализованной версии
поисковой системы два адреса в Интернете: http://www.yandex.ru и
http://www.ya.ru. По первому адресу находится портал, где можно найти
информацию, получить доступ к новостям, создать свой почтовый ящик. По
второму адресу располагается веб-страница, на которой имеется только форма
для ввода запроса.
Сегодня
естественном языке, а также утверждает, что такой возможности нет у других
поисковых систем. В идеале это означает, что машина ищет не просто по всем
словам, указанным в запросе, а «с пониманием смысла». Вы вводите слово или
фразу, а ответ дается в соответствии со смысловой нагрузкой запроса.
Например, если задан запрос «идти», то в результате поиска будут найдены
ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.
На запрос «окно» будет выдана информация, содержащая и слово «окон», а на
запрос «отзывали» - документы, содержащие слово «отозвали».
При составлении запросов надо учесть, что
язык запросов, синтаксис которого только в общих чертах совпадает с языками