Читаем Интернет – легко и просто! полностью

2. «Червяк» (crawler) – как и паук, занимается скачиванием страниц. Кроме того, он исследует обнаруженные веб-страницы и извлекает все находящиеся на них ссылки. Полученные ссылки впоследствии будут использоваться пауком для дальнейшего путешествия по Сети.

3. Индексатор (indexer) – программа, служащая для упорядочивания информации, найденной пауками. Индексатор разбивает текст документа на составляющие его слова, при этом запоминая их местонахождение, анализируя, написано слово прописными или строчными буквами, является ли оно названием документа, текстом ссылки и т. д.

4. База данных (database) – представляет собой хранилище всех обработанных данных, накопленных поисковой системой.

5. Механизм выдачи результатов (search engine) – предназначен для взаимодействия пользователя с базой данных. С ним вы постоянно будете иметь дело при поиске какой-либо информации. Именно этот механизм определяет, какие вебстраницы вам представлять в соответствии с вашим запросом.

После задания вами ключевого слова или фразы поисковая система осуществляет поиск и выдает вам результат, который представляет собой список найденных веб-страниц, соответствующих вашему запросу. Для определения порядка, в котором будет показаны документы в списке, поисковая машина применяет алгоритм ранжирования. В идеале наиболее релевантные вашему запросу страницы будут расположены в списке первыми. Однако идеальный алгоритм ранжирования не найден, поэтому каждая поисковая система использует собственный, хотя отбор результатов во всех системах основывается примерно на следующих критериях:

– наличие ключевых слов в заголовке;

– плотность ключевых слов в содержимом документа, то есть количество искомых слов в тексте веб-страницы;

– расположение ключевых слов в документе;

– стиль ключевых слов (полужирный, курсив);

– индекс цитируемости – количество ссылок, ведущих на данную веб-страницу с других страниц;

– наличие ключевого слова в имени домена или адресе страницы.

После того как вы щелкнете на ссылке одного из документов в списке, предложенном вам поисковой системой, веб-страница будет запрошена с того сервера, на котором она находится.

<p>Популярные поисковые машины</p>

Наиболее популярны следующие поисковые машины:

– Google –(рис. 4.1);

– Yahoo! – http://www.yahoo.com;

– AltaVista – http://www.altavista.com;

– Lycos – http://www.lycos.com;

– Excite – http://www.excite.com;

– AOL Search – http://search.aol.com;

– HotBot – http://www.hotbot.com.

На этом, разумеется, список популярных поисковых систем не заканчивается – их количество исчисляется сотнями. Однако я уверен, что для работы с англоязычными сайтами вам с лихвой хватит и этих.

Следует отметить, что практически все представленные выше поисковые машины могут работать и с кириллицей. Но для поиска информации на русском языке все-таки рекомендую отечественные поисковые системы:

– Яндекс – http://www.yandex.ru;

– Рамблер – http://www.rambler.ru;

– Апорт – http://www.aport.ru;

– mail.ru – http://www.mail.ru.

Существуют и другие русскоязычные поисковые системы, однако эти наиболее популярны, особенно первые две.

Рис. 4.1. Поисковая система Google

<p>Формирование запросов</p>

Если вы не хотите углубляться в детали техники поиска, то можете просто задать поисковой машине вопрос так же, как задали бы его человеку, у которого хотите получить совет. Например, «как быстро похудеть», «есть ли жизнь на Марсе», «где раки зимуют» (рис. 4.2) или просто «работа журналиста».

Не исключено, что вы быстро найдете интересующую вас информацию. Но может случиться так, что поисковая система завалит вас кучей совсем не интересных вам ссылок. Так, на запрос «работа журналиста» Яндекс нашел более 180 000 документов.

Одними из первых в списке стояли ссылки на веб-страницы с информацией о конкурсе работ журналистов на тему иммунизации населения против кори и краснухи, о регламентировании работы журналистов в кризисных ситуациях и о влиянии внесенных дополнений к закону о СМИ на работу журналистов. Все это, конечно, довольно занимательно, но вряд ли вас удовлетворит.

Получить слишком много информации не намного лучше, чем не получить ничего. Мудрецы считают, что правильно заданный вопрос уже содержит в себе половину ответа. Это особенно справедливо по отношению к поисковым машинам.

Существует немало способов увеличения эффективности поиска. Рассмотрим самые основные из них.

Рис. 4.2. Формирование поискового запроса

<p>Увеличение количества ключевых слов</p>
Перейти на страницу:

Похожие книги

1001 совет по обустройству компьютера
1001 совет по обустройству компьютера

В книге собраны и обобщены советы по решению различных проблем, которые рано или поздно возникают при эксплуатации как экономичных нетбуков, так и современных настольных моделей. Все приведенные рецепты опробованы на практике и разбиты по темам: аппаратные средства персональных компьютеров, компьютерные сети и подключение к Интернету, установка, настройка и ремонт ОС Windows, работа в Интернете, защита от вирусов. Рассмотрены не только готовые решения внезапно возникающих проблем, но и ответы на многие вопросы, которые возникают еще до покупки компьютера. Приведен необходимый минимум технических сведений, позволяющий принять осознанное решение.Компакт-диск прилагается только к печатному изданию книги.

Юрий Всеволодович Ревич

Программирование, программы, базы данных / Интернет / Компьютерное «железо» / ОС и Сети / Программное обеспечение / Книги по IT
Самоучитель современного пользователя ПК
Самоучитель современного пользователя ПК

В самоучителе рассмотрены темы, актуальные для современного пользователя ПК: цифровое фото, запись, оцифровка, обработка и воспроизведение звуковых и видеофайлов; Web-камеры, запись компакт-дисков, а также сканирование и печать изображений, работа с дигитайзерами, подключение плазменных панелей и телевизоров к ПК. Для начинающих пользователей в необходимом объеме изложены основные сведения об устройстве компьютера и видах программ, описаны настройка и работа в инструментальных и сервисных программах (диагностика и проверка ПК, файловые менеджеры, программы-антивирусы и архиваторы). Дополнительно изложены вопросы восстановления работоспособности ПК. Рекомендуется широкому кругу читателей — начинающих пользователей и работающих на ПК, которые интересуются возможностями новой аппаратуры и программного обеспечения.

В. В. Мельниченко , Н. В. Калиниченко

Интернет / Компьютерное «железо» / ОС и Сети / Программное обеспечение
Викиномика
Викиномика

Это знаменитый бестселлер, который научит вас использовать власть массового сотрудничества и покажет, как применять викиномику в вашем бизнесе. Переведенная более чем на двадцать языков и неоднократно номинированная на звание лучшей бизнес-книги, "Викиномика" стала обязательным чтением для деловых людей во всем мире. Она разъясняет, как массовое сотрудничество происходит не только на сайтах Wikipedia и YouTube, но и в традиционных компаниях, использующих технологии для того, чтобы вдохнуть новую жизнь в свои предприятия.Дон Тапскотт и Энтони Уильямс раскрывают принципы викиномики и рассказывают потрясающие истории о том, как массы людей (как за деньги, так и добровольно) создают новости, изучают геном человека, создают ремиксы любимой музыки, находят лекарства от болезней, редактируют школьные учебники, изобретают новую косметику, пишут программное обеспечение и даже строят мотоциклы.Знания, ресурсы и вычислительные способности миллиардов людей самоорганизуются и превращаются в новую значительную коллективную силу, действующую согласованно и управляемую с помощью блогов, вики, чатов, сетей равноправных партнеров и личные трансляции. Сеть создается заново с тем, чтобы впервые предоставить миру глобальную платформу для сотрудничества

Дон Тапскотт , Энтони Д. Уильямс

Деловая литература / Интернет / Финансы и бизнес / Книги по IT