Имеется также отдельно распространяемый Web-интерфейс (в виде Web-сайта для IIS, Apache или другого сервера с поддержкой CGI), обеспечивающий подключение к «Cros» удаленных пользователей и выполнение с банком данных всех основных операций.
Данное программное обеспечение устойчиво работает в ОС Windows, нетребовательно к ресурсам, удобно и просто в эксплуатации. Существуют как локальная, так и сетевая версии этого программного продукта.
Если сравнивать с имеющимися аналогами, то «CROS» практически не имеет ограничений по объему накапливаемой информации, при этом значительно экономит пространство на жестком диске.
Имеется бесплатная демонстрационная версия с усеченными возможностями, она работает с одним банком данных объемом до 5000 документов. Цена однопользовательской версии «CROS» — $140, при установке на несколько компьютеров в одной и той же организации предлагаются существенные скидки.
4. " Евфрат 99"
) (Cognitive Technologies). Этот продукт тоже представляет собой не «чистый» поисковик, а систему организации электронного документооборота в персональном масштабе, что подразумевает максимальную автоматизацию создания и ввода типичных офисных документов, а также их организацию, регистрацию, хранение, архивирование и, соответственно, поиск.«Евфрат @SOHO» — это практически полноценная рабочая среда со своим рабочим столом, корзиной, средствами работы с файлами и т. д. Помимо всех этих «прибамбасов» программа «понимает» документы Microsoft Office, индексирует их и выполняет контекстный поиск и даже автоматически следит за обновлением указанных документов и папок. Основной ее недостаток — отсутствие поддержки прочих форматов, в частности PDF, но имеются и кое-какие приятные дополнительные возможности вроде встроенной OCR для ввода документов со сканера. Стоимость программы $20.
«Евфрат Office» поддерживает форматы документов MS Office 95/97/2000 (DOC, XLS, PPT), текстовые (RTF, HTML, TXT (ASCII, ANSI, KOI-8), графические документы — черно-белые и цветные — TIF, PCX, JPG, BMP, GIF и другие. Работает «черновой» режим просмотра (с учетом оригинального оформления и форматирования документа). Имеется функция экспорта во внешние приложения, поддерживающие необходимый формат.
«Евфрат Office» осуществляет полнотекстовый и реквизитный поиск документов по запросу любой сложности с использованием логических операций «И», «ИЛИ», «НЕ», контекстный поиск (запрос по выделенным словам документа в режиме просмотра его текста). Скорость поиска достаточно высока и не зависит от количества зарегистрированных документов и сложности запроса.
Имеется дополнительно устанавливаемый модуль Евфрат Document Server, который обеспечивает одновременную работу нескольких пользователей с единой базой данных.
Краткое резюме.
В конце нашего обзора хотелось бы отметить, что выбор программного обеспечения у вас есть — это весьма эффективные dtSearch Desktop, «Ищейка», «Следопыт», «Cros» и «Ефрат», за обладание которыми придется расстаться с некой толикой зеленых общечеловеческих ценностей.Ну в если ваше прижимистое руководство денег на программное обеспечение не дает, а результаты требует, то не стоит забывать про AVSearch. Правда, временные и трудовые затраты в данном случае значительно возрастают.
Сравнительный анализ поисковых систем, проведенный НПК «Кронос-Информ»
Постановка задачи
Хранить большое количество текстовых файлов различных форматов. Проводить поиск по тексту и другим реквизитам документов. Готовить обзоры, справки, отчеты, рефераты на основе найденных документов.
Список программ для тестирования
CROS 2.08, НПК «Кронос-Информ».
Следопыт 2.0, MediaLingva.
Clio 1.2, Software House.
Ищейка 2.18, iSleuthHound Technologies.
Евфрат 99 DELUXE (Build 0430), Cognitive Technologies.
Конечно, это программы разных групп, но их применение в рамках поставленной задачи вполне правомерно. По крайней мере, найдется немало пользователей, которые пытаются использовать эти программы для решения подобной задачи.
Параметры массива документов для тестирования
Общее количество файлов *) 1652
В том числе:
Текстовые (кодировка DOS, Windows) 1366
Документы формата MSWord 7.0 226
Документы формата Html 60
Общее количество вложенных папок 15
Общий размер файлов (байт) ** 336 735 760
В том числе:
Текстовые (кодировка DOS, Windows) 264 950 779
Документы формата MSWord 7.0 69 587 789
Документы формата Html 2 197 192
Максимальный размер файла (байт) 13 927 759
Минимальный размер файла (байт) 1657
*) Выбиралось с учетом того, что демо-версия «Ищейки» не работает более чем с 2000 файлами.
**)Выбирался из расчета (ОБЪЕМ RАМ * 5).
Тесты проводились на компьютере следующей конфигурации:
Intel Celeron 400, 64Mb RAM, HDD Quantum CR 13Gb (файловая система: NTFS),
Windows NT4Sp6 Workstation.
Перед каждым тестом диск дефрагментировался.
Результаты тестирования режима добавления документов