Options installées : OpenSSH server et LAMP server
Comme root :
Installation des mises à jour :sudo -i
Installation des prérequis :apt-get update
apt-get upgrade
apt-get install make gcc lib32z1 libmysqlclient15-dev php5-dev
Voir : http://www.mnogosearch.org/doc33/msearch-installing.html
Garder les options par défaut sauf si vous avez besoin du module PHP, alors l'adaptation suivante est nécessaire (voir http://www.mnogosearch.org/board/message.php?id=19290) :wget http://www.mnogosearch.org/Download/mnogosearch-3.3.14.tar.gz
tar -zxf mnogosearch-3.3.14.tar.gz
cd mnogosearch-3.3.14/
./install.pl
Création de la base de données :Build shared libraries? (yes/no) [no]: yes
make
make install
Création d'un utilisateur spécifique :mysql -u root -p
create database mnogosearch default character set utf8 default collate utf8_general_ci;
Installation de xpdf pour l'indexation des fichiers PDF :grant all privileges on mnogosearch.* to user_mnogosearch@localhost identified by "pass_mnogosearch";
exit
Création du fichier de configuration :apt-get install xpdf
Adapter la ligne de connexion à la base de données :cd /usr/local/mnogosearch/etc/
cp indexer.conf-dist indexer.conf
nano indexer.conf
Décommenter la ligne :DBAddr mysql://user_mnogosearch:pass_mnogosearch@localhost/mnogosearch/?dbmode=blob
Adapter la valeur en fonction de la taille des documents à indexer :LocalCharset UTF-8
Commenter la ligne :MaxDocSize 104857600
Décommenter la ligne :#Disallow *.pdf
Décommenter/modifier la ligne :Mime application/pdf text/plain "pdftotext $1 -"
Décommenter/modifier la ligne :Robots no
Les fichiers à indexer sont placés, par exemple, dans un sous-dossier pdf de l'arborescence web (/var/www/pdf).RemoteCharset UTF-8
Copier les fichiers à indexer dans ce répertoire...Server http://votre.site/pdf/
Adapter la ligne de connexion à la base de données :cd /usr/local/mnogosearch/etc/
cp search.htm-dist search.htm
nano search.htm
Modifier les lignes :DBAddr mysql://user_mnogosearch:pass_mnogosearch@localhost/mnogosearch/?dbmode=blob
Télécharger search.htm.LocalCharset UTF-8
BrowserCharset UTF-8
Indexation (ces 2 commandes sont à exécuter périodiquement par exemple via un job cron) :/usr/local/mnogosearch/sbin/indexer -Ecreate
Copier le script cgi vers l'emplacement web :/usr/local/mnogosearch/sbin/indexer
/usr/local/mnogosearch/sbin/indexer -Eblob
Rendez-vous à :cp /usr/local/mnogosearch/bin/search.cgi /usr/lib/cgi-bin/
Si pendant vos tests vous souhaitez vider le contenu de la base de données :http://votre.site/cgi-bin/search.cgi
Statistiques de la base de données :/usr/local/mnogosearch/sbin/indexer -C
/usr/local/mnogosearch/sbin/indexer -S
Se placer dans le répertoire des sources (dans mon cas /root) :
Activer le module :cd /root/mnogosearch-3.3.14/php/
phpize
./configure --with-mnogosearch=/usr/local/mnogosearch
make
make install
Copier le fichier index.php vers l'arborescence web :nano /etc/php5/apache2/php.ini
extension=/usr/lib/php5/20090626/mnogosearch.so
service apache2 restart
Adapter les lignes :cp index.php /var/www/
$dbaddr='mysql://user_mnogosearch:pass_mnogosearch@localhost/mnogosearch/?dbmode=blob';
$localcharset='UTF-8';
$browsercharset='UTF-8';
Si vos fichiers ne contiennent pas la métadonnée "titre", "No title" s'affichera, pour résoudre ce problème, modifiez le fichier index.php :
devient (par exemple) :$title=Udm_Get_Res_Field($res,$i,UDM_FIELD_TITLE);
Quelques pages de documentation intéressantes :$title=Udm_Get_Res_Field($res,$i,UDM_FIELD_URL);
$dbaddr='mysql://user_mnogosearch:pass_mnogosearch@localhost/mnogosearch/?dbmode=blob&trackquery=yes';