понеділок, 26 березня 2012 р.

Recoll - линза для полнотекстового поиска

Recoll является инструментом для полнотекстового поиска по содержимому файлов MS Office, LibreOffice, OpenOffice, PostScript, MP3 и других аудио файлов, JPEG и многое другое.

Кроме обычного поиска Recoll позволяет использовать операции, помогающие найти автора, размер файла, формат файла и оперирует понятиями И / ИЛИ.

поисковая система recoll

Линза Recoll позволяет использовать его в Dash без открытия дополнительного GUI. Линза имеет фильтры для Текста, Таблиц, Презентаций, Медиа или Сообщений. Для продвинутого поиска придётся научится языку запросов Recoll.

Примеры:

  • author:"john doe"
  • metallica OR megadeth
  • /2007 (все документы с 2007 или старее)
  • dir:/путь/к/папке (фильтр на папку /путь/к/папке)

Установка Unity Recoll Lens

Unity Recoll Lens доступна в Recoll PPA для Ubuntu.

sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on
sudo apt-get update
sudo apt-get install recoll-lens

Будучи однажды установленным, нужно запустить индексацию файлов. Для этого вызовите Dash и напечатайте Recoll. Когда он закончит индексировать - выйдите из системы и зайдите снова.

Вызывайте Dash и печатайте свои запросы. Если вы не используйте Unity, то вы можете установить recoll вместо recoll-lens и получить Qt интерфейс. Настройки Recoll позволят вам указать какие папки можно сканировать, а какие нет.

Желательно указать в Запуск Приложений команду ionice -c 3 /usr/bin/recollindex -m, которая позволит в дальнейшем индексировать только изменения в системе и делать это с минимальным файловым приоритетом idle, что не грузит систему и не будет вам мешать.

Помогите Recoll и поставьте нужное

sudo apt-get install antiword pstotext unrtf untex libimage-exiftool-perl catdoc djvulibre-bin python-chm

Немає коментарів:

Дописати коментар

HyperComments for Blogger

comments powered by HyperComments