Читаем Бизнес-разведка полностью

Однако есть и весьма существенное НО: для эффективного использования каталога пользователю нужно правильно угадать принцип структуризации, который был применен при его создании и который зачастую существует только в головах авторов каталога. Поэтому для компенсации неудобств каталогов (если уж пользователь не знает, на какой ветке дерева «по логике» данного каталога лежит нужная ссылка, то не найдет ее никогда) они в последнее время стали включать и средства поиска. И наоборот — поисковые машины стали снабжаться каталогами; в частности обзавелся своим тематическим каталогом ресурсов ветеран русского Интернета «Рамблер».

В качестве примера для возможных изысканий можно привести следующие каталоги:

Yahoo ;

«Ay!» ;

«List.Ru» ;

«Рамблер» ;

«Лица российских сайтов» ;

«Улитка» ;

«Золотое Кольцо Российского Интернета» .

При работе с классификаторами следует учитывать, что сайты классифицируются разными каталогами по‑разному, это и понятно, так как Интернет‑пространство в принципе не может быть упорядочено линейно, оно имеет более сложную геометрию.

Например, каталог «Omen.Ru» уже на первом уровне структуризации своей коллекции оперирует более чем с 200 рубриками. «Рамблер» в качестве стартовой процедуры поиска информации предлагает 50 рубрик, одна из которых — «Классификаторы» — объединяет более 200 каталогов.

Сайты, обнаруженные в каталогах, от базы данных Федеральной комиссии по ценным бумагам до регистрационной базы данных по предприятиям Санкт‑Петербурга (http:/ /www.infobroker.ru), как мы увидим далее, могут оказаться весьма полезными в дальнейшей работе.

Помимо хранилищ общего назначения существует множество специализированных каталогов, помогающих пользователям ориентироваться в достаточно узких предметных областях.

Ну а для тех, кто желает повысить свой профессиональный уровень, познакомиться со свежими новостями, а также пообщаться с коллегами на форуме, можно порекомендовать для ознакомления следующие специализированные сайты, посвященные вопросам безопасности: электронная версия журнала «БДИ» , Интернет‑газета по безопасности сайт по безопасности и сайт . С более полной подборкой сайтов по вопросам безопасности можно ознакомиться в тематическом каталоге Рамблера «Безопасность».


4. Поисковые системы


Еще один простой и дешевый способ информационно‑поисковой работы в Интернете — воспользоваться услугами бесплатных поисковых систем.

С помощью поисковых систем можно осуществлять различные манипуляции с информацией: индексирование текстов и поиск по одному (нескольким) ключевым словам (по индексу); морфологический поиск — разбор и отождествление различных грамматических форм слов; ранжирование по степени соответствия документа запросу.

На сегодняшний день самыми эффективными русскоязычными поисковыми системами являются Яндекс (www.yandex.ru), Апорт (www.aport.ru), Рамблер (www.rambler.ru). Из личного опыта могу посоветовать начинать именно с Яндекса, у него самая производительная поисковая машина, к тому же на его сайте имеются ссылки практически на все другие поисковики. Так, например, Яндекс дает ссылку на одну из лучших западных поисковых машин Google (www.google.com), которая при поиске информации просматривает свыше 1 600 млн. страниц.

Стоит отметить, что даже самые лучшие поисковые машины обрабатывают только вершину имеющегося в сети информационного айсберга. Поисковые роботы не могут просматривать закрытые для них коммерческие сайты, число которых в настоящее время приближается к миллиону. Эти сайты различны по содержанию (информация правительственная, законодательная, статистическая, научно‑техническая, патентная, новостная и т. п.) и форме — например, сайты, содержащие видеоинформацию, музыкальные сайты.

Поиск нужной информации в данном случае осуществляется по следующему алгоритму: задается ключевое (поисковое) слово или фраза, и система ищет данное слово или фразу в базе данных, автоматически составленной поисковой машиной на основе текстового содержимого исследуемых сайтов.

Имеющимися техническими средствами полностью формализовать процедуру поиска информации пока не представляется возможным. Из‑за того, что до настоящего времени не существует стандарта на размещение информации в Интернете, реализовать сложную стратегию поиска часто бывает весьма затруднительно. Поэтому при ведении аналитической разведки средствами Интернета приходится идти по пути информационной избыточности, что накладывает весомые ограничения на релевантность найденных документов. Из‑за высокого процента информационного шума в общем объеме найденных документов значительно увеличивается время, необходимое для аналитической обработки полученных сведений.

Следует отметить, что результативность поиска в данном случае зависит от двух составляющих.

Во‑первых, от степени соответствия ключевого слова или фразы поставленной информационной задаче, т. е. релевантности информационного запроса.

Перейти на страницу:

Похожие книги

Антихрупкость. Как извлечь выгоду из хаоса
Антихрупкость. Как извлечь выгоду из хаоса

«Антихрупкость» – книга уникальная: она рассказывает о ключевом свойстве людей, систем и не только, свойстве, у которого до сих пор не было названия. В мире, где царит неопределенность, нельзя желать большего, чем быть антихрупким, то есть уметь при столкновении с хаосом жизни не просто оставаться невредимым, но и становиться лучше прежнего, эволюционировать, развиваться. Талеб формулирует простые правила, которые позволяют нам преодолеть хрупкость и действовать так, чтобы непредсказуемая неопределенность, этот грозный и внезапный Черный лебедь, не причинила нам вреда – и более того, чтобы эта редкая и сильная птица помогла нам совершенствоваться. Для этого следует в первую очередь осознать: мы по природе своей антихрупки – и не должны позволять кому бы то ни было лишать нас этого чудесного свойства.

Нассим Николас Талеб

Деловая литература / О бизнесе популярно / Финансы и бизнес