Partager via


Définition de règles d'analyse et types de fichiers

Dans Recherche de contenu d'entreprise dans Microsoft Office SharePoint Server 2007, les règles d'analyse et les extensions permettent de définir la façon dont un ensemble particulier de contenus d'une source de contenu doit être analysé.

Règles d'analyse

Les règles d'analyse permettent de définir le comportement du moteur d'index Recherche de contenu d'entreprise lorsque vous souhaitez analyser le contenu d'un chemin d'accès en particulier. À l'aide de ces règles, vous pouvez :

  • Empêcher le contenu d'un chemin d'accès particulier d'être analysé.

    Par exemple, lorsqu'une source de contenu pointe vers l'URL https://www.microsoft.com/, mais que vous souhaitez empêcher le contenu du sous-répertoire « downloads » https://www.microsoft.com/downloads/ d'être analysé, vous devez configurer une règle pour l'URL, avec le comportement permettant d'exclure le contenu de ce sous-répertoire.

  • Indiquer qu'un chemin spécifique qui est exclu de l'analyse doit être analysé.

    Dans le scénario précédent, si le répertoire de téléchargements contenait un répertoire appelé « Content » qui devait être inclus dans l'analyse, vous devriez créer une règle d'analyse pour l'URL suivante, avec un comportement défini pour inclure le sous-répertoire « Content » https://www.microsoft.com/downloads/content.

Notes

Cela s'applique uniquement au contenu HTTP.

  • Spécifier des informations d'authentification.

    Cette règle doit être utilisée pour un scénario dans lequel le contenu en cours d'accès nécessite des informations d'identification différentes de ce qui est spécifié pour le compte d'accès au contenu par défaut.

Vous pouvez utiliser l'astérisque (*) comme caractère générique dans les règles d'analyse, par exemple :

http://*.microsoft.com/*.html

Notes

N'utilisez pas les règles comme un autre moyen de définir des sources de contenu ou de fournir une étendue. Vous devez au contraire les utiliser pour spécifier plus de détails sur la façon de gérer un ensemble particulier de contenu à partir d'une source de contenu.

Ordre de la règle d'analyse

L'ordre de la règle est important, car la première règle qui correspond à un ensemble particulier de contenu est celle qui est appliquée. Par conséquent, dans l'exemple précédent, étant donné que la règle qui exclut les pages .aspx est répertoriée en premier, à chaque fois que l'analyseur rencontre une page .aspx dans http://nom d'hôte, la page est exclue, même si elle correspond aux deux règles et aucune autre règle n'est appliquée.

Modèle objet de la règle d'analyse

Les règles d'analyse individuelles sont représentées par la classe CrawlRule. L'ensemble complet des règles d'analyse est contenu dans la classe CrawlRuleCollection. À l'aide de la classe CrawlRuleCollection, vous pouvez ajouter de nouvelles règles d'analyse avec la méthode Create, définir la priorité d'une règle d'analyse existante à l'aide de la méthode SetPriority et tester une URL ou un chemin d'accès par rapport à toutes les règles d'analyse afin de déterminer celui ou celle qui s'appliquera avec la méthode Test.

Pour les mises à jour ou pour tester des règles d'analyse individuelles, utilisez l'objet CrawlRule. Vous devez également utiliser cet objet pour spécifier les informations d'identification d'accès au contenu à utiliser pour le contenu qui correspond à cette règle, ou pour supprimer la règle.

Types de fichiers

La liste d'inclusions/exclusions de type de fichier contient la liste des extensions qui identifient les types de fichiers que l'analyseur doit inclure ou exclure de l'index. Pour que l'analyseur puisse extraire des contenus et des propriétés d'un type de fichier particulier, un filtre doit être installé pour ce type de fichier sur le serveur sur lequel le service d'index s'exécute.

Vous pouvez également utiliser la liste pour exclure un type particulier de fichier, même s'il existe un filtre installé associé à ce type de fichier.

Modèle objet Type de fichier

Les extensions de noms de fichiers individuelles sont représentées par la classe Extension. Vous pouvez utiliser cet objet pour supprimer une extension de nom de fichier. Les extensions sont regroupées à l'intérieur d'un objet ExtensionCollection. Utilisez la méthode Create pour spécifier une nouvelle extension de nom de fichier.

Voir aussi

Référence

Microsoft.Office.Server.Search.Administration.CrawlRule
Microsoft.Office.Server.Search.Administration.Extension

Autres ressources

Gestion du contenu
Mise en route avec le modèle objet Administration de recherche de contenu d'entreprise
Procédure : renvoyer le contexte de recherche pour le fournisseur du service de recherche