Метапоиск
Одно из правил успешного поиска состоит в использовании нескольких поисковых машин. Причина, по которой следует так поступать, очевидна: все они используют разные алгоритмы поиска с разной скоростью, и страница, которая найдется при помощи одного поисковика, может остаться вне поля зрения другой системы – либо программа до нее еще не добралась, либо посчитала сайт несоответствующим запросу. Кроме этого, ни одна поисковая машина, даже самая хорошая, не может «похвастаться» полнотой своей базы данных.
Разработчики специальных поисковых машин решили воплотить в жизнь идею объединения результатов работы сразу нескольких таких систем. Эти технологии носят название метапоисковиков. Метапоисковые системы на самом деле являются лишь мостом между пользователем и набором стандартных поисковиков. Они не ведут собственную базу интернет-сайтов, а лишь обрабатывают результат, предоставляемый другими поисковыми машинами. Степень этой обработки может быть разной. Самые простые метапоисковики позволяют удалить повторяющиеся ссылки и создать единый список сайтов, упорядоченный по релевантности.
Первые метапоисковики фактически позволяли работать с несколькими видами поиска: не только на сайтах, но и, например, в словарях, энциклопедиях, каталогах и дискуссионных группах. Следующим шагом в развитии метапоиска стало появление новых способов обработки полученных результатов.
Очевидное преимущество такого поиска – более высокая релевантность выдаваемых ссылок. Не ограничиваясь данными одной поисковой системы, с помощью этой технологии можно собрать более полную информацию об интересующем вас предмете. С другой стороны, метапоисковые системы часто отбрасывают или выносят в самый конец результатов те страницы, которые содержатся лишь в одной поисковой базе, даже если ссылка идеально соответствует запросу. Проще говоря, вы можете потерять ценные ссылки, особенно если это достаточно новая страница, которая пока не внесена в базы данных большинства поисковых машин.
Работа с метапоисковой системой практически не отличается от поиска с помощью любой другой поисковой машины. Обычно она использует те же операторы построения запроса, имеет похожий формат вывода информации. Правда, при построении запроса в некоторых системах можно выбрать, в базах каких именно поисковых машин вы бы хотели искать информацию.
Обычно метапоисковые средства позволяют настраивать список используемых поисковых машин, а в некоторых случаях его можно дополнять самим. Эта возможность особенно важна для русскоязычных пользователей, так как в состав списка средств метапоисковых систем редко входят русскоязычные сайты.
В результатах поиска часто присутствует дополнительное поле – ссылка на поисковый сайт, с помощью которого была найдена данная ссылка.
Последние метапоисковики позволяют проводить кластеризацию (объединение) полученных адресов сайтов по разным критериям. Такие системы выявляют в списке полученных сайтов общие ключевые фразы и группируют страницы в соответствии с ними. Метапоисковые системы, поддерживающие кластеризацию, обычно предлагают как минимум два списка результатов поиска. Это обычный список сайтов и список кластеров – ключевых слов, в соответствии с которыми были сгруппированы полученные результаты поиска. Выбор ключевого слова в этом списке приведет к отображению соответствующих ему ссылок на найденные сайты.
Одна из первых метапоисковых систем, использующих группировку результатов документа на основе кластерной технологии, – http://vivisimo.com (рис. 10.4).
Рис. 10.4. Метапоисковая система Vivisimo