Поисковая система CNSearch Pro состоит из модуля индексации и модуля поиска. Индексатор производит анализ сайта (или группы сайтов) и создает индексные файлы (индекс); модуль поиска осуществляет быстрый поиск по созданному индексу.
Для запуска индексации следует выполнить следующие действия:
В данном примере localhost - название задачи, а http://localhost/my_site - адрес Вашего сайта.
C:\indexer.exe localhost
или
C:\indexer.exe --config=D:\www\search.conf localhost
./indexer name_of_task
или
./indexer.exe --config=/home/www/search.conf name_of_task
Для осуществления индексации нескольких сайтов следует в файле search.conf указать адреса данных сайтов в рамках одной задачи:
В случае если копия Вашего сайта размещена на Вашем компьютере, возможна локальная индексация файлов сайта с последующим переносом индексного файла на сервер (подробнее см. search.conf).
По завершении процесса индексации система создает следующий комплекс индексных файлов:
По завершении процесса индексации система создает следующий комплекс индексных файлов:
Примечание: На данный момент в системе реализованы два типа индексации
Для оптимизации процесса поиска по индексным файлам в системе предусмотрена возможность дефрагментации индекса: результаты индексации систематизируются, что позволяет значительно ускорить последующий поиск. Для этого следует скопировать файл idefrag.exe, расположенный в каталоге индексатора, в папку с индексными файлами (index.cns, docs.cns и files.cns) и запустить на исполнение. По окончании процесса файл docs.cns будет заменен файлом results.cns.
Примечание: Дефрагментированные индексные файлы не подлежат изменениям.
Для осуществления поиска по созданному индексу следует выполнить следующие действия:
Для удобства просмотра списка возможна сортировка результатов поиска по дате или по релевантности.
Настройка интерфейса списка результатов поиска осуществляется с помощью шаблонов (см. Настройка шаблонов).
Файл 'fulltxt.cns' содержит тексты всех индексируемых документов: эта информация позволяет отображать образцы текста, содержащие выделенный поисковый запрос, в результатах поиска. Например:
Однако, файл 'fulltxt.cns' может достигать больших размеров. В этом случае его можно удалить либо отменить его создание при помощи параметра Type (см. search.conf) в процессе индексации; в этом случае результаты поиска будут выглядеть следующим образом (без выделения и цитирования, отображаются только первые 256 символов документа):