Читаем Как раскрутить и разрекламировать Web-сайт в сети Интернет полностью

5. Нажмите на кнопку OK.

Для проверки правописания во встроенном редакторе выделите необходимый фрагмент текста и выполните команду Tools Spell Check (Инструменты → Проверка правописания). Если требуется проверить весь текст, пригодна операция Tools Spell Check All (Инструменты → Проверка правописания во всем).

Чтобы контролировать правописание страниц не только в редакторе, но и в процессе сканирования, выполните команду Options Validator Engine Options (Опции → Опции системы проверки). Откроется окно Validator Engine Options. Перейдите в нем на вкладку Validator 1 (рис. 2.183) и отметьте флажок Enable spell checking (Разрешить проверку правописания). Теперь по мере сканирования HTML-документов программа будет генерировать список слов с ошибками.

Рис. 2.183. Окно Dictionaries , вкладка Validator 1

Глава 3 Работа с поисковыми системами и каталогами

Обзор поисковых систем

Российские поисковые системы

Яndex

Поисковая машина Яndex (http://www.yandex.ru/) обладает наибольшей в российской части Internet базой данных и развернутой системой формирования запроса. Ею индексируется информация российских (домены RU и SU) и зарубежных серверов, имеющих в своем составе страницы, написанные на русском языке.

Дата официального открытия Яndex – 23 сентября 1997 года. Идея, разработка и техническое обеспечение проекта принадлежат компании с одноименным названием.

Яndex – это полнотекстовая информационно-поисковая система, учитывающая морфологию русского языка. Таким образом, в индекс попадают все слова, найденные на Web-странице, за исключением самых частотных слов русского и английского языков (стоп-слов). Все лексические единицы, попавшие в индекс, доступны для поиска. Адресом слова в Яndex являются документ (точнее, его URL-адрес), номер предложения и номер слова внутри предложения. Кроме страниц сайтов, поиск идет по новостям информационных агентств и по товарам электронных магазинов.

Обнаружив новую или измененную страницу, Яndex ее индексирует. В этом случае страница разбивается на элементы (текст, заголовки, подписи к картинкам, ссылки и т. д.), содержание которых заносится в индекс. При этом учитываются позиции слов, то есть их положение в документе или его элементе. Сам документ в базе не хранится.

Яndex индексирует страницы по их истинным адресам. Это значит, что, если на странице стоит перенаправление (например, с помощью метатэга HTTP– EQUIV="Refresh"), робот воспримет его как ссылку на новый адрес и поставит ее в очередь на индексирование. То же самое произойдет, если в одном из фреймов будет стоять ссылка на другой сервер. В частности, если эта ссылка находится вне доменов, разрешенных по умолчанию, страница не будет проиндексирована. Робот Яndex хранит дату последнего обхода каждой страницы, дату ее изменения, присланную Web-сервером, и информацию о времени внесения последних изменений в базу поиска (дату индексации). Он оптимизирует обход Сети таким образом, чтобы чаще посещать наиболее изменяемые серверы.

Яndex индексирует документ полностью: текст, заголовок, подписи к картинкам, описание (description), ключевые слова и некоторую другую информацию.

Робот работает со стандартными ссылками языка HTML (HREF, LINK и FRAME), то есть так, как работал бы пользователь с отключенными Java и JavaScript.

Поиск учитывает все морфологические формы слов запроса по правилам русского языка. Например, при запросе «идти» в результате поиска будут найдены ссылки на документы, содержащие слова: «идти», «идет», «шел», «шла» и т. д. На запрос «окно» будет выдана информация, содержащая и слово «окон», а на запрос «отзывали» – документы со словом «отозвали». Таким образом, можно подавать запрос на естественном языке, представляя область поиска лишь в общем виде.

При этом поиск не ограничен только словами или фразами. Яndex отыщет по названию Web-страницу компании или файл с нужной картинкой.

Перейти на страницу:

Похожие книги

Полное руководство по Microsoft Windows XP
Полное руководство по Microsoft Windows XP

В книге известного американского автора описывается среда ОС Windows XP и принципы ее функционирования, приведен сравнительный анализ Windows XP с предшествующими версиями операционной системы Windows. Рассматриваются вопросы применения и модификации нового интерфейса с целью получения прямого доступа ко всем функциям Windows XP обсуждаются варианты подключения к компьютерным сетям. Несколько разделов посвящены работе с реестром и конфигурационными файлами, мультимедийным функциям и разнообразным системным службам, а также методам решения проблем с программным обеспечением и оборудованием. Особое внимание уделено обеспечению безопасности операционной системы.Издание адресовано пользователям и сетевым администраторам, желающим активно применять возможности операционной системы Windows XP (в том числе и недокументированные).

Джон Поль Мюллер , Питер Нортон

ОС и Сети, интернет / ОС и Сети / Книги по IT
Веб-аналитика: анализ информации о посетителях веб-сайтов
Веб-аналитика: анализ информации о посетителях веб-сайтов

Компании в веб-пространстве тратят колоссальные средства на веб-аналитику и оптимизацию своих веб-сайтов, которые, в свою очередь, приносят миллиарды долларов дохода. Если вы аналитик или работаете с веб-данными, то эта книга ознакомит вас с новейшими точками зрения на веб-аналитику и то, как с ее помощью сделать вашу компанию весьма успешной в веб. Вы изучите инструментальные средства и показатели, которые можно использовать, но что важнее всего, эта книга ознакомит вас с новыми многочисленными точками зрения на веб-аналитику. Книга содержит много советов, приемов, идей и рекомендаций, которые вы можете взять на вооружение. Изучение веб-аналитики по этой уникальной книге позволит познакомиться с проблемами и возможностями ее современной концепции. Написанная практиком, книга охватывает определения и теории, проливающие свет на сложившееся мнение об этой области, а также предоставляет поэтапное руководство по реализации успешной стратегии веб-аналитики.Эксперт в данной области Авинаш Кошик в присущем ему блестящем стиле разоблачает укоренившиеся мифы и ведет по пути к получению действенного понимания аналитики. Узнайте, как отойти от анализа посещаемости сайта, почему основное внимание следует уделять качественным данным, каковы методы обретения лучшего понимания, которое поможет выработать мировоззрение, ориентированное на мнение клиента, без необходимости жертвовать интересами компании.- Изучите все преимущества и недостатки методов сбора данных.- Выясните, как перестать подсчитывать количество просмотренных страниц, получить лучшее представление о своих клиентах.- Научитесь определять ценность показателей при помощи тройной проверки "Ну и что".- Оптимизируйте организационную структуру и выберите правильный инструмент аналитики.- Изучите и примените передовые аналитические концепции, включая анализ SEM/PPC, сегментацию, показатели переходов и др.- Используйте решения с быстрым началом для блогов и электронной торговли, а также веб-сайтов мелкого бизнеса.- Изучите ключевые компоненты платформы экспериментирования и проверки.- Используйте анализ конкурентной разведки для обретения понимания и принятия мер.Здесь также находятся:- Десять шагов по улучшению веб-аналитики.- Семь шагов по созданию управляемой данными культуры в организации.- Шесть способов замера успеха блога.- Три секрета создания эффективной веб-аналитики.- Десять признаков великого веб-аналитика.

Авинаш Кошик

ОС и Сети, интернет