Gérer les fichiers de mots vides (SharePoint Server 2010)
S’applique à : SharePoint Server 2010
Dernière rubrique modifiée : 2015-03-09
Un mot vide, ou mot parasite, est un mot qui est ignoré par le système de recherche dans les requêtes de recherche effectuées par l’utilisateur final. Un mot peut être désigné comme mot vide lorsqu’il apparaît si souvent dans une langue que son utilité est improbable dans l’identification ou l’affinage des résultats de recherche. Par exemple, des articles tels que « un » et « le » sont généralement spécifiés comme mots vides pour le français. Si un utilisateur tape la requête « la montagne la plus haute », « le » est supprimé de la requête s’il s’agit d’un mot vide, de sorte que la requête devient « montagne plus haute ». Les mots potentiellement injurieux sont également parfois désignés comme mots vides.
Dans cet article :
Présentation des fichiers de mots vides
Modifier un fichier de mots vides
Fichiers de mots vides par langue
Présentation des fichiers de mots vides
Les mots vides pour une langue donnée sont répertoriés dans le fichier de mots vides associé à cette langue. Le programme d’installation de Microsoft SharePoint Server 2010 installe automatiquement un fichier de mots vides pour chaque langue prise en charge par le produit. Suite à l’installation, une grande partie des fichiers de mots vides contiennent certains mots vides par défaut pour la langue associée. Par exemple, par défaut le fichier de mots vides pour l’anglais (États-Unis) (noiseenu.txt) contient les mots a, and, is, in, it, of, the, to. À tout moment après l’installation du produit, l’administrateur de recherche peut ajouter ou supprimer des mots dans un fichier de mots vides afin d’améliorer la pertinence des résultats de recherche ou afin de répondre aux exigences de l’organisation. Pour plus d’informations sur l’ajout ou la suppression de mots vides dans un fichier de mots vides, voir Modifier un fichier de mots vides plus loin dans cet article. Pour plus d’informations sur les langues prises en charge, voir Fichiers de mots vides par langue plus loin dans cet article.
Lors de la requête, l’analyseur lexical de la langue de la requête identifie les mots individuels en déterminant l’emplacement des limites de mots en fonction des règles lexicales propres à cette langue. Il supprime ensuite les mots de la requête qui figurent dans le fichier de mots vides.
Par défaut, les fichiers de mots vides pour toutes les langues prises en charge sont installés dans %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config. Lorsqu’un administrateur de batterie crée une application de service de recherche, le système de recherche copie automatiquement les fichiers de mots vides à partir de l’emplacement d’installation (y compris tout fichier de mots vides modifié par un administrateur de recherche) vers %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config, où GUID est le GUID de la nouvelle application de service de recherche. Le système de recherche effectue la même opération sur chaque serveur de requête qui exécute la nouvelle application de service de recherche. Ainsi, il existe une copie de chaque fichier de mots vides sur chaque serveur de requête qui exécute cette application de service de recherche.
Modifier un fichier de mots vides
Si vous modifiez un fichier de mots vides à l’emplacement d’installation, le système propage automatiquement le fichier de mots vides modifié vers les applications de service de recherche qui sont créées par la suite. En revanche, le fichier de mots vides modifié n’est pas propagé automatiquement vers les applications de service de recherche existantes. Pour chaque application de service de recherche existante à laquelle vous souhaitez appliquer les modifications, vous devez copier manuellement le fichier modifié vers le dossier d’application de service de recherche sur chaque serveur de requête qui exécute l’application de service de recherche.
Notes
-
Si vous supprimez un fichier de mots vides, le système de recherche risque de considérer tous les caractères uniques comme des mots vides et de les supprimer des résultats de recherche. Un fichier de mots vides doit contenir au moins une entrée, même s’il s’agit d’un simple point (.).
-
Si vous supprimez un fichier de mots vides et redémarrez ensuite le service SharePoint Server Search 14, le système de recherche remplace automatiquement le fichier en copiant le fichier du même nom à partir de %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config vers le dossier où le fichier a été supprimé.
Appliquez la procédure suivante pour modifier un fichier de mots vides.
Pour modifier un fichier de mots vides
Vérifiez que le compte d’utilisateur qui exécute cette procédure est membre du groupe Administrateurs du serveur local.
Ouvrez le fichier de mots vides dans un éditeur de texte. Pour plus d’informations sur la recherche et l’identification du fichier de mots vides approprié, voir Présentation des fichiers de mots vides plus haut dans cet article.
Modifiez le fichier de manière à n’inclure que les mots qui doivent être ignorés par le système de recherche dans les requêtes de recherche.
Enregistrez le fichier de mots vides.
Notes
Lorsque vous enregistrez un fichier de mots vides, utilisez toujours la valeur Codage par défaut, à savoir Unicode.
Redémarrez le service SharePoint Server Search 14 à l’aide des étapes suivantes :
Cliquez sur Démarrer, pointez sur Outils d’administration, puis cliquez sur Services.
Cliquez avec le bouton droit sur SharePoint Server Search 14, puis cliquez sur Redémarrer.
Les modifications de mots vides prennent effet après le redémarrage du service SharePoint Server Search 14.
Notes
Dans Microsoft Office SharePoint Server 2007, le système de recherche excluait les mots vides des requêtes et de l’index. Par conséquent, après la suppression par un administrateur d’un mot dans un fichier de mots vides, il était nécessaire d’effectuer une analyse complète afin d’indexer toute instance de ce mot vide susceptible d’être rencontrée par le robot. Par contraste, dans SharePoint Server 2010, le système de recherche exclut les mots vides des requêtes, mais par conception il n’exclut pas les mots vides de l’index. Par conséquent, dans SharePoint Server 2010, si vous supprimez un mot d’un fichier de mots vides, il n’est pas nécessaire d’effectuer de nouvelle analyse car le mot vide figure déjà dans l’index s’il a été rencontré durant une analyse. (Si vous ajoutez un mot à un fichier de mots vides, il est également inutile d’effectuer une nouvelle analyse car le système de recherche ne recherche pas de mots vides dans l’index.)
Fichiers de mots vides par langue
Lorsque vous installez SharePoint Server 2010, les fichiers de mots vides sont installés pour les langues suivantes. Si un fichier de mots vides n’existe pas pour une langue, le système de recherche utilise le fichier de mots vides neutre noiseneu.txt.
Langue | Nom du fichier de mots vides |
---|---|
Arabe |
noiseara.txt |
Bengali |
noiseben.txt |
Bulgare |
noisebul.txt |
Catalan |
noisecat.txt |
Tchèque |
noiseces.txt |
Chinois (simplifié) |
noisechs.txt |
Chinois (traditionnel) |
noisecht.txt |
Croate |
noisecro.txt |
Danois |
noisedan.txt |
Néerlandais (Pays-Bas) |
noisenld.txt |
Anglais (Royaume-Uni) |
noiseeng.txt |
Anglais (États-Unis) |
noiseenu.txt |
Finnois |
noisefin.txt |
Français |
noisefra.txt |
Allemand |
noisedeu.txt |
Grec |
noisegrc.txt |
Gujarati |
noiseguj.txt |
Hébreu |
noiseheb.txt |
Hindi |
noisehin.txt |
Hongrois |
noisehun.txt |
Islandais |
noiseice.txt |
Indonésien |
noiseind.txt |
Italien |
noiseita.txt |
Japonais |
noisejpn.txt |
Kannada |
noisekan.txt |
Coréen |
noisekor.txt |
Langue neutre |
noiseneu.txt |
Letton |
noiselav.txt |
Lituanien |
noiselit.txt |
Malais |
noisemal.txt |
Malayalam |
noisemly.txt |
Marathi |
noisemar.txt |
Norvégien (Bokmål) |
noisenor.txt |
Polonais |
noiseplk.txt |
Portugais (Portugal) |
noisepor.txt |
Portugais (Brésil) |
noiseptb.txt |
Pendjabi |
noisepun.txt |
Roumain |
noiserom.txt |
Russe |
noiserus.txt |
Serbe (cyrillique) |
noisesbc.txt |
Serbe (latin) |
noisesbl.txt |
Slovaque |
noisesvk.txt |
Slovène |
noiseslo.txt |
Espagnol |
noiseesn.txt |
Suédois |
noisesve.txt |
Tamoul |
noisetam.txt |
Télougou |
noisetel.txt |
Thaï |
noisetha.txt |
Turc |
noisetur.txt |
Ukrainien |
noiseurk.txt |
Ourdou (Pakistan) |
noiseurd.txt |
Vietnamien |
noisevie.txt |