Индексация одного 2.5Гб ZIP-архива с FB2 занимает у меня на машине 20 с, на VPS от DigitalOcean - 9 с.
Итак, индексация полного архива (88 файлов) заняла ровно 15 минут. Поисковый индекс занял 55 мб, а весь процесс (с базой данных в оперативной памяти) - 900 мб.
Упомянутые 88 файлов-архивов - это стандартные zip-архивы с содержимым Флибусты (только fb2), распространяемые через торренты (напр. https://booktracker.org/viewforum.php?f=245). Сейчас уже больше... :) ...Каждый - примерно по 2,5 гигабайта.
Т.е. после запуска fb2index
Где скачать?
https://gitlab.com/opennota/fb2index/-/releases
Скриншоты
Способы использования
Способы использования fb2index ограничены только фантазией создателя библиотеки. Возможные примеры (из обсуждения на Флибусте):
Его достоинство - поднимать апач, потом ещё php и sql, да ставить друпал, да на него накладывать ларинский движок, да потом всё это долго настраивать - всего этого
Уже сейчас запустить движок может любой линуксоид (ибо сборка стандартная, парой команд), а если автор таки скомпилирует движки (и для Винды, да)[4], то и вовсе всё будет молниеносно.
Достоинства очевидны.
Недостатки: вся работа по улучшению книг д.б. произведена с файлами книг. Что лежит в архивах - то и будет в выдаче. Это недостаток для коллективной работы, типа как на Флибусте, но мелочь для "авторских" библиотек, которые делает один человек. Он и так будет работать главным образом с файлами - подбор, отсев дублей, улучшение и т.п.
Также - оформление выдачи. Оно жёсткое, минималистичное, изменить его произвольно нельзя. (По мне так тоже невелик недостаток... Главное, что книги ищутся - а поиск работает оч.хорошо, скачиваются, опционально читаются)
Возможные применения: широчайшие. От "сам себе Флибуста" (скачал торренты, залил на хостинг, запустил...) до "библиотека избранных книг" (долго подбирал, выложил). Могут работать несколько человек - каждый подбирает книги и оформляет их в архив (например - ПСС какого-то автора, "вылизанное" до максимальной возможности), присылает (возможно - сразу заливает на хостинг, если это "доверенное лицо"). Дальше только переиндексировать (15 минут, ага) и - всё в доступе.
Думаю, что в паре с ТорЭкспертом этот движок и скрытый сервис может.[5]
Работает
...Короче говоря, с этим движком
Это - возможность, которой раньше не было. За что автору - большое спасибо.
Пример запуска движка