Эта процедура выполняется в фоновом режиме и может занимать значительное время. Когда в архив вносятся новые документы или изменяются старые, индекс достраивается. При запросе на поиск «искалка» обращается только к индексу и быстро составляет список файлов, в которых формально встречаются искомые слова в нужных сочетаниях. Из найденных документов неплохо бы составить списки, их можно обрабатывать дальше, в частности загружать документы для последующей работы в текстовые процессоры, электронные таблицы, выводить на печать. Таким образом, за счет небольших предварительных затрат времени при текущей работе над архивом достигается высокая скорость при обращении с запросом.
Использование для организации архива и/или его справочного аппарата различных систем управления базами данных (СУБД) требует, как правило, существенных расходов на приобретение программного обеспечения, определенной квалификации разработчиков и пользователей, а также значительных трудозатрат на создание и пополнение баз данных (БД). Больше всего времени уходит на описание документов в БД – предварительную обработку документа: оценку его смысла, присвоение каждой записи систематических индексов и ключевых слов, наилучшим образом отражающих его содержание, установление связей между записями базы данных. В специальные поля можно занести сведения об авторах, персонах, названия организаций, даты, статистическую информацию, систематические индексы, ключевые слова, аннотации, ссылки на источник публикации, место хранения документа, линк ресурса в Интернете и многое другое. В некоторых случаях прямо в полях базы данных хранят даже тексты документов или прямые ссылки на них.
Журналисту-расследователю помогают в его работе базы данных, организованные по двум типам (это же относится и к архивным материалам вообще): «объектоцентрический»
и «источникоцентрический». В первом случае вся информация об объекте (персоне, организации, строении, событии) собирается с течением времени в одной записи БД, посвященной этому объекту, а на источники информации (исходные документы) устанавливаются ссылки. Например, ссылки на статью в газете о преступлениях банды из 10 человек в Приморском районе Санкт-Петербурга могут попасть в 10 персональных записей на членов этой банды, а также в следующие записи: о бандитизме, о криминальной обстановке в Приморском районе, о деятельности РУБОПа, о деятельности оперативника (имярек), о грабежах, об убийствах, об угоне автомобилей и т. д. Это требует больших трудозатрат и творческих усилий, зато каждая запись подобной базы данных в любой момент времени представляет собой фактически готовое досье на человека, событие, явление.При организации баз данных по второму типу конкретной статье в газете (или документу) соответствует только одна запись, с указанием в полях ключевых слов: фамилий бандитов, видов преступлений, географических или топографических объектов и т. д. Это менее трудоемкий и более формальный процесс. В данном случае досье собирается лишь на стадии поиска в базе данных. Такой подход уменьшает трудозатраты на стадии сбора материалов и увеличивает их на этапе поиска информации в архиве и ее обработки.