Первые (к ним относится Google и самый известный российский новостной агрегатор — Яндекс) работают полностью автоматически; другие, например Yahoo, предполагают активное участие человека-редактора. Работает новостной агрегатор с уже готовыми лентами новостей, которые формируются самыми разными новостными источниками — это информационные агентства, такие, как “Рейтер” или “Франс Пресс”, газеты, новостные ленты радиостанций и телеканалов или различные интернет-издания. Каждый такой источник выкладывает свои новости в виде, удобном для чтения программой-агрегатором, как правило, это — RSS. Агрегатор, например Google, считывает ленты источников и пытается распределить сообщения по темам, то есть разобраться, какие из них говорят об одном и том же событии. Это довольно трудная задача. Фактически это задача обратная той, которую решает поисковая система, когда подбирает интернет-странички, соответствующие поисковому запросу. Если при поиске сначала вводится поисковый запрос, а потом по нему подбираются ресурсы, то при агрегировании новостных сообщений в рамках одного сюжета поисковик располагает множеством сообщений и как бы подбирает поисковый запрос, которому они могли бы соответствовать. Как только такой запрос удается выделить, новостные сообщения объединяются в сюжет или тему на сайте агрегатора новостей. Например, в тот момент, когда пишется эта заметка, на сайте
news.yandex.ruодной из главных тем является сообщение о том, что Мадонна пригласила Папу Римского на свой концерт. Из 1414 новостных лент-источников, которые обработал Яндекс, в сюжет вошли 53 сообщения за последние двое суток. Сюда попали и опубликованное Мадонной приглашение Папе, и осуждение Мадонны Римской католической церковью за то, что певица предстала на сцене распятой на огромном кресте и в терновом венце. По мере разрастания сюжета он совершает свой подъем на верхние ступеньки новостного рейтинга. Здесь работают несколько критериев: число новостных сообщений, объединенных в сюжете, количество просмотров новостей пользователями и другие. Необходимо отметить, что поисковики, как правило, принципы образования и ранжирования новостных сюжетов не разглашают, поскольку опасаются манипулирования со стороны создателей новостных лент. (Почему рейтинг сюжета важен для новостников, мы поговорим ниже.)