Accueil > SharePoint 2013 > SharePoint 2013 : Gérer les synonymes dans la recherche grâce au thésaurus

SharePoint 2013 : Gérer les synonymes dans la recherche grâce au thésaurus


dinosaur-readingVous ne vous êtes pas trompé de blog, un thésaurus n’est pas un dinosaure, mais est bien un mot présent dans votre dictionnaire préféré (voir la définition de Wikipédia ci-dessous).

Concernant SharePoint 2013, il s’agit d’un fichier à utiliser dans le cadre de la recherche et qui va vous permettre de définir une liste de synonymes (mots ou phrases).

Il existe un thésaurus par ferme, pouvant être mis à jour par PowerShell.

 

Définition (épurée) de Wikipédia

Un thésaurus est une liste organisée de termes contrôlés et normalisés représentant les concepts d’un domaine de la connaissance.

C’est un langage contrôlé utilisé pour l’indexation de documents et la recherche de ressources documentaires dans des applications informatiques spécialisées. Les termes sont reliés entre eux par des relations de synonymie (terme équivalent), de hiérarchie (terme générique et terme spécifique) et d’association (terme associé) ; chaque terme appartient à une catégorie ou domaine.

Procédure de mise à jour

Dans SharePoint 2013, vous ne pouvez pas exporter le thésaurus de votre ferme.

Pour mettre à jour celui-ci, vous devez :

1. Créer un fichier .csv contenant les données des synonymes :

  • La clé : Mot ou phrase pour lequel/laquelle vous souhaitez créer un synonyme,
  • Le synonyme : Mot ou phrase associé(e) à la clé et qui sera ajouté(e) à la requête,
  • La langue concernée : En option, le code de la langue (voir ici) associée à ce synonyme.

2. Déployer le thésaurus via PowerShell :

$searchApp = Get-SPEnterpriseSearchServiceApplication

Import-SPEnterpriseSearchThesaurus -SearchApplication $searchApp -Filename <CheminDuFichierCSV>

CheminDuFichierCSV étant le chemin vers le fichier CSV (étonnant hein ?).

Notes :

  • Tout déploiement de thésaurus écrasera la version précédente,
  • Pour réinitialiser les synonymes, il suffit de déployer un fichier csv vide.

Tests de fonctionnement

Je créée pour l’occasion un fichier csv contenant les lignes suivantes.

Pour la relation entre l’ASVED et Patrick Guimonet (son blog est ici), je vous renvoie à l’article La Conf’SharePoint, c’est fini, et c’était Pluto bien ! :).

Note : Dans le screenshot ci-dessous il y a un espace à droite de la virgule sur la dernière ligne (c’est une erreur, mais qui ne change rien à mon exemple), sachez que cet espace sera inclus dans la valeur du synonyme.

2

1. J’effectue une recherche sans le thésaurus déployé (une content source contenant l’URL de mon blog est crawlée) :

1

2. Je le déploie (notez que le chemin du csv doit être au format UNC, même si le fichier est en local)

3

3. Sans autres manipulations, je relance la même recherche que précédemment : mon synonyme du mot « ASVED » est bien ajouté à ma requête !

4

4. Si vous voulez suivre un peu ce qu’il s’est passé, allez dans l’admin centrale, puis « Monitoring / Configure Diagnostic logging »

Dépliez « Search », cochez « Query processing » et passez-le en « Verbose ».

7

5.  Je relance ici le même requête depuis le Search Center et je file ensuite voir dans les logs ULS (Attention si vous cliquez sur l’image ci-dessous, les lignes piquent un peu les yeux).

8

Si vous cliquez, vous verrez les différentes étapes :

  • Avant l’application du thesaurus,
  • Découverte d’un synonyme,
  • Après l’application du thesaurus – On voit que la partie concernant le synonyme est ajoutée à la requête, avec à priori un poids de 0,2 (voir paragraphe suivant),
  • Et accessoirement que l’espace saisi par erreur dans le csv est bien pris en compte comme valeur du synonyme.

Poids des termes

SharePoint associe à chaque terme un poids, et rapport au dernier article cité dans la partie « Références » de cet article, le poids attribué aux synonymes n’est pas le même que celui attribué aux termes originaux (0,2 vs 1), ce qui rend (à priori) les résultats relatifs aux synonymes moins visibles.

Toujours dans cet article, l’auteur utilise le « Ceres Shell » (C:\Program Files\Microsoft Office Servers\15.0\Search\Scripts\ceresshell.ps1″) pour modifier le poids associé aux synonymes.

Je vous conseille la lecture de cet article si le sujet vous intéresse.

Références

Catégories :SharePoint 2013 Étiquettes : , , ,
  1. Christophe SARTEEL
    septembre 9, 2016 à 10:49

    Cela ne semble pas fonctionner quand il y a des mots avec accents dans le dictionnaire

  1. juin 10, 2013 à 12:47

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :