Математический алгоритм – это специальный набор шагов, которым необходимо следовать для решения какой-либо математической задачи или выполнения и завершения компьютерного процесса. Еще один способ представить алгоритм – посмотреть на него как на кулинарный рецепт. Пошаговое выполнение инструкций необходимо для достижения конкретного результата.
И у него на примете был как раз подходящий математический ум для этой работы: Сергей Брин. Оказалось, что Сергей тоже все еще был в поиске своей темы диссертации. Идея Ларри показалась ему захватывающей. Сергей объяснил: «Потому что она касалась сети, которая является отражением людских знаний, и потому что Ларри мне понравился».
Но это не было простой задачей. В конце концов, они собирались сосчитать и проанализировать все ссылки со всей всемирной паутины, все 10 миллионов страниц. Им бы понадобилось запустить поискового бота, собирать ссылки, хранить их, а затем еще и анализировать их ценность. Это значит, что нужно было скачать Всемирную сеть – всю целиком.
У поисковых ботов есть пара других крутых имен: сборщики и пауки! Боты это ничто иное, как программы, которые посещают веб-страницы и считывают их содержимое. Каждый сборщик (или бот) охотится на конкретную информацию. Как только он ее находит, паук создает базу данных или индекс того, что найдено, облегчая доступ к информации.
Пропускная способность, необходимая для такой задачи, должна была быть внушительной, намного шире, чем для обычного проекта студента Стэнфорда. Это было куда более крупное дело. Не говоря уже о том, что они собирались работать с кучей данных и им бы понадобился сервер, который бы смог вместить и хранить в себе столько информации.
Сервер – это компьютер со специальной задачей или набором задач. Есть много различных видов серверов. Некоторые, например, хранят файлы или управляют трафиком сети или обеспечивают загрузку веб-страниц. Предназначение сервера определяется его программным обеспечением.
Пропускная способность (ширина полосы) – это частота передачи данных, обычно измеряемая в битах в секунду для данного канала. Наименьшая единица информации в компьютере известна как двоичный символ или бит. Бит – это всегда 1 или 0. Если речь идет о битах в секунду, имеется в виду то, как быстро эти мельчайшие частицы информации передаются или принимаются за одну секунду.
В далеком 1995 году у людей были модемы, которые подключались к Интернету по телефонным линиям. Максимальная скорость была 0,056 мегабита в секунду (Мбит/с). Сегодня большинство людей в Америке подключаются к Интернету со скоростью как минимум в 20 Мбит/с. Это значит, что сегодня мы можем скачивать фотографии мгновенно. Но тогда даже загрузка одного изображения низкого качества могла занять несколько минут.
Попрошайничество, Заимствование, Шпионаж
Что делать, если тебе нужна тонна компьютерного оборудования, но у тебя нет тонны денег? Именно с такой проблемой столкнулись Ларри и Сергей. Сидя в своем кабинете, также известном как Гейтс 360 (да, он назван в честь