Partager via


Recherche des éléments similaires (FAST Search Server 2010 for SharePoint)

Les fonctionnalités de recherche d’éléments similaires permettent de rechercher des documents qui sont similaires aux résultats de requête déjà extraits.

Dernière modification : jeudi 1 septembre 2011

L’évaluation de la similarité est basée sur une mesure statistique. FAST Search Server 2010 for SharePoint crée automatiquement un composant de similarité qui est ajouté à la requête.

Dans cet article
Type de requête de recherche d’éléments similaires
Référence du vecteur de similarité d’élément
Tri des résultats de requête de recherche d’éléments similaires

S’applique à : SharePoint Server 2010

Type de requête de recherche d’éléments similaires

Cette propriété représente le type de requête de recherche d’éléments similaires à effectuer.

Les vecteurs de document de chaque élément, triés par poids décroissant, peuvent être utilisés pour générer trois types de recherche de similarité pour un élément d, étant donnée une requête d’origine Q. Ces requêtes de recherche de similarité sont transformées en une nouvelle requête unique, en utilisant la réécriture de la requête suivante (affichée selon une représentation symbolique, pas dans le langage de requête exact) :

  • FindSimilar : Query = Q OR <s1,w1> [OR <sm,wm>]* Les vecteurs de similarité sont ajoutés à la requête à l’aide d’un opérateur OR. Cela signifie que la requête d’origine est incluse dans la requête réécrite, mais la nouvelle requête peut faire correspondre des articles similaires même si la requête d’origine n’est pas satisfaite.

  • RefineSimilar : Query = Q AND (<s1,w1> [OR <sm,wm>]*) La requête va correspondre si les conditions de la requête d’origine et les conditions de vecteur de similarité sont remplies. Par exemple, affiner la requête d’origine pour contenir des éléments similaires à l’élément indiqué dans <SimilarTo>.

  • ExcludeSimilar : Query = Q ANDNOT (<s1,w1> [OR <sm,wm>]*) La requête va correspondre si les conditions de la requête d’origine sont remplies, mais pas les conditions de similarité.

    <s,w> indique le vecteur de similarité de l’élément calculé pendant le traitement de l’élément.

Valeur par défaut : FindSimilar

Notes

Le composant de similarité qui est ajouté à la requête (<s1,w1> [OR <sm,wm>]*) interroge l’index de texte intégral par défaut.

Référence du vecteur de similarité d’élément

Cette propriété représente une référence de similarité lors de la recherche des éléments similaires. Il s’agit d’une représentation sous forme de vecteur de similarité qui est retournée pour chaque élément du résultat de la requête, dans la propriété gérée docvector.

La valeur est une chaîne mise en forme selon le format suivant :

[string1,weight1][string2,weight2]...[stringN,weightN]

Lorsque vous effectuez une requête de recherche d’éléments similaires, l’élément SimilarTo doit contenir un paramètre string avec la valeur de la propriété gérée docvector de l’élément qui doit être utilisée comme référence de similarité. Le vecteur de similarité se compose d’un jeu d’expressions « terme, poids », qui indique les termes ou les concepts les plus importants dans l’élément et l’importance perçue correspondante (poids). Les termes peuvent être des mots ou des phrases.

Le poids est une valeur de type float comprise entre 0 et 1, où 1 indique la pertinence plus élevée.

Le vecteur de similarité est créé au cours du traitement de l’élément et indique les termes ou les concepts les plus importants dans l’élément et le poids correspondant.

Tri des résultats de requête de recherche d’éléments similaires

La propriété FindSimilar spécifie si les résultats de la requête basés sur la similarité sont triés par similitude ou par rang.

Lorsque vous effectuez une requête de recherche d’éléments similaires, les résultats peuvent être triés de deux manières :

  • Par score de pertinence (rang). Il s’agit de la méthode de tri des requêtes normales, qui correspond à SortSimilar="False".

  • Par similarité. Il s’agit du tri par défaut des requêtes de similarité, où les éléments les plus similaires sont listés en premier. Cela correspond à SortSimilar="True".

Valeur par défaut : True