Наиболее странным и полезным сервисом, основанным на тех же поисково-бродильных технологиях, можно считать archive.org. Этот сайт позволяет заглянуть в прошлое Сети. Так, если с помощью других поисковых машин вам встретится упоминание интересного ресурса, которого больше не существует, смело идите на Аrchive.org (полностью сервис называется Internet Archive — Wayback Machine, то есть машина-времени-в-прошлое), предварительно вооружившись нужной ссылкой. Скорее всего, если только владельцы ресурса предварительно не запретили индексирование сайта с помощью файла robots.txt, вы найдете одну или несколько его сохраненных версий. Вероятно, даже сможете, прослезившись, найти там свою домашнюю страницу образца какого-нибудь 1997 года. Вот только один вопрос беспокоит нас уже много лет: где эти ребята берут столько места на винчестерах? И кто за это платит?
С помощью поисковых машин можно готовить и атаки на тот или иной сайт. Не будем превращать материал в руководство к действию, но перечислим возможности. Во-первых, исследование сайта (особенно, если его администраторы не сильно заботились о безопасности) с помощью поисковика позволит провести разведку, не прикасаясь собственно к интересующему вас объекту, то есть админ не заметит попыток взлома, даже изучив логи. Google ведь безопасен, правда?
Так, часто используют кэш Google, в котором можно найти много любопытных сохраненных страниц определенного сайта (например, со словом login); используется поиск related (похожих) страниц — например, страницы, похожие на главную, могут лежать на сайте неспроста.
Карта сайта, показываемая Google-командой site, откроет вам много любопытных страниц, ссылок на которые уже нет. Поиск страниц с незащищенным списком файлов по ключам index of или parent directory даст знающему человеку определенные козыри. Наконец, найдя ошибку в каком-либо популярном скрипте, с помощью поисковика можно найти его копии на других серверах.
Помнить об этих возможностях полезно не только малолетним «кулхацкерам», но и всем, кто так или иначе связан с администрированием сайтов, — с помощью поисковой машины вы найдете потенциальные уязвимости раньше, чем до них доберутся другие.
Не знаю, бывают ли хорошие монополисты, и не знаю, хочу ли это узнать. Но 70% рынка поиска, принадлежащие Google, внушают уже не только трепет, но и опасения. С другой стороны, Microsoft давно грозится выпустить обновленную версию MSN, которая будет поисковиком не хуже Google, и не факт, что у Редмонда это не получится.
Google обычно старается не комментировать планы на будущее, и оттого пофантазируем.
Грядет Интернет-2, IPv6, о которых мы уже писали в ДК #12_2005. Интернет со скоростью мысли не может остаться без последствий: скорее всего, сервисы Google Maps/Google Earth рано или поздно станут сервисами реального времени, и мы будем смотреть не на снимки нашей планеты трехлетней давности, а на реальную картинку в данную секунду — ведь это дело техники и трафика. Вслед за этим должны появиться сервисы поиска «картинки по картинке» — я показываю образец, поисковая машина приносит мне все, что на него похоже. (Некоторые реализации этого сервиса уже есть — например, WhatTheFont
, который по картинке может определить гарнитуру и производителя неизвестного вам шрифта.) Поиск «картинки по картинке» может в сочетании с Google Maps стать поиском человека/строения/местности на карте планеты.С запросами «простым языком» все плохо. Во-первых, синтез речи сделан давным-давно, а ее распознавание все еще, прямо скажем, — нерешенная задача. Во-вторых, ситуация с ребрендингом Дживса (см. выше) настораживает.
Радует, что война поисковых спамеров и их противников ведется с переменным успехом, но в последнее время с перевесом в сторону «светлых». Спамоловки стали умнее, фильтры — чувствительнее, а вычислительные мощности — простите, мощнее, что позволяет чаще пересчитывать и уточнять PR и прочие тИЦ.
В Интернете ходит забавный текст о возможном будущем Google. Прогнозы составили бывшие сотрудники Google, а также технические специалисты/спекулянты/футурологи. Представлены четыре варианта развития событий. Согласно трем из них, компания станет монополистом в медиасреде, Интернете, а также в науке и новых разработках. Четвертый сценарий предсказывает вырождение и гибель Google от одного из собственных детищ — из-за его мощи и необъятности.
Три к одному… что ж, шансы есть. Но не правда ли, забавно, что миром будет править компания, придумавшая толковый поиск в Интернете?
Двигаем мебель
Автор: Ольга Шемякина.
© 2003-2006, Издательский дом | http://www.computerra.ru/
Журнал «Домашний компьютер» | http://www.homepc.ru/
Этот материал Вы всегда сможете найти по его постоянному адресу: /2006/122/284567/
Говорят, чтобы немного «освежить» свою жизнь, бывает достаточно переставить мебель в квартире. Вот и я займусь небольшой перестановкой в своей десятиполосной каморке.