Partager via


Informations sur le langage de requête SQL de la recherche SharePoint

Dernière modification : mercredi 21 avril 2010

S’applique à : SharePoint Server 2010

Dans cet article
Identificateurs
Littéraux
Respect de la casse
Non-respect des accents
Informations sur les valeurs de pertinence
Utilisation de recherches localisées
Dans cette section

Recherche Microsoft SharePoint Server 2010 fournit des fonctionnalités d’analyse et de recherche qui prennent en charge la recherche en texte intégral. Le langage de requête utilisé par Recherche SharePoint Server étend la syntaxe des requêtes de base de données SQL-92 et SQL-99 standard en améliorant son utilisation avec les recherches basées sur du texte.

Identificateurs

Les identificateurs spécifient les noms des colonnes (parfois appelés propriétés), les catalogues et les alias. En revanche, les littéraux spécifient des valeurs numériques et des valeurs de chaîne.

Vous pouvez créer des identificateurs d'une longueur maximale de 128 caractères et, dans l'un des deux types, caractérisés par les caractères utilisés dans le nom de l'identificateur :

  • **Identificateurs littéraux   **Contiennent seulement les caractères A-Z, a-z, 0-9 et le trait de soulignement, et commencent par une lettre. Il ne faut pas les placer entre des guillemets doubles.

  • Identificateurs délimités    Peuvent contenir n'importe quel caractère Unicode valide et doivent être placés entre des guillemets doubles.

Les identificateurs que vous créez en tant qu'URN (Uniform Resource Name) doivent contenir des caractères spéciaux, sont toujours des identificateurs délimités et doivent être placés entre des guillemets doubles.

Notes

Vous pouvez utiliser l’astérisque (*) en tant qu’identificateur spécial de colonne lorsque vous souhaitez indiquer que Recherche SharePoint Server inclut l’ensemble des propriétés indexées de la requête. Bien que ce ne soit pas un identificateur littéral, il ne nécessite pas de guillemets doubles.

Littéraux

Un littéral est une chaîne de caractères qui représente une valeur dans une instruction de requête. Vous utilisez des littéraux pour comparer des valeurs de colonne ou pour spécifier les termes recherchés. Recherche SharePoint Server prend en charge les types de littéraux suivants.

Chaîne

Les littéraux de chaîne ne sont pas limités en longueur et ils peuvent contenir des caractères ANSI (American National Standard Institute) ou Unicode. Vous devez placer les littéraux de chaîne entre des guillemets simples. Pour inclure un guillemet simple à l'intérieur d'un littéral de chaîne, utilisez deux guillemets simples. Représentez une chaîne vide sous la forme de deux guillemets simples consécutifs ('').

Numérique

Les littéraux numériques représentent des nombres, y compris des entiers positifs et négatifs, des nombres décimaux et des valeurs monétaires, et ils peuvent contenir les chiffres 0-9, un point et la lettre E (ou e). Vous pouvez définir des littéraux numériques à l'aide de la notation scientifique (par exemple, 2,3E-05). Ne placez pas un littéral numérique entre des guillemets simples, sinon il sera interprété en tant que littéral de chaîne et comparé à l'aide des techniques de comparaison de chaîne. Les valeurs monétaires ne peuvent pas contenir de symboles de devise.

Hexadécimal

Un littéral hexadécimal représente un entier non signé spécifié dans la notation hexadécimale ; il peut contenir les chiffres 0-9 et les lettres A-F et a-f. Les littéraux hexadécimaux doivent commencer par 0x.

Notes

La norme SQL-92 requiert que les littéraux hexadécimaux soient placés entre des guillemets simples ; cependant, Recherche SharePoint Server ne prend pas en charge cette notation.

Booléen

Les littéraux booléens représentent des valeurs logiques et peuvent avoir la valeur TRUE ou FALSE. Ne placez pas un littéral booléen entre des guillemets simples, sinon il sera interprété en tant que littéral de chaîne.

Date

Les littéraux de date représentent des dates spécifiques, des horodatages ou des dates/heures relatives, et sont entourées de guillemets simples. Vous devez spécifier les dates sous la forme année/mois/jour ou année-mois-jour, où les mois, le jour et l'année sont des nombres. Spécifiez l'année avec une valeur à quatre chiffres, par exemple 2004. Les heures doivent être spécifiées sous la forme heures:minutes:secondes. La syntaxe des dates/heures relatives est basée sur la DATEADD, fonction dans la syntaxe SQL de recherche SharePoint.

Respect de la casse

Les requêtes de Recherche SharePoint Server ne respectent pas la casse. Cela inclut les mots clés des requêtes (SELECT est identique à Select, à select et à sELect) et les termes de la recherche. Si un identificateur ou un littéral utilise des caractères Unicode qui ont une sémantique de mappage de casse, le moteur de recherche considère que toutes les casses sont équivalentes.

Non-respect des accents

Les requêtes de Recherche SharePoint Server ne respectent pas la casse et ne respectent pas non plus les accents lors de l’utilisation du prédicat FREETEXT ou du prédicat CONTAINS. Une recherche pour le terme « Resume » renvoie également les documents qui contiennent « Résumé ». Si un identificateur ou un littéral contient des caractères Unicode accentués, la requête de recherche établit également une correspondance avec des entrées qui contiennent des caractères combinés Unicode utilisant le caractère de base du caractère accentué dans l’identificateur ou le littéral.

Notes

Ce n'est pas le cas pour les plages de caractères 0x2e81-f8ff et 0x1100-0x11ff.

Informations sur les valeurs de pertinence

Lors de leur utilisation dans une base de données relationnelle, les lignes qui sont renvoyées par une requête de recherche doivent respecter toutes les conditions spécifiées par la requête. En revanche, une requête de Recherche SharePoint Server peut renvoyer des documents qui répondent aux conditions de recherche à des degrés divers.

Par exemple, une recherche du terme « programme » dans une base de données relationnelle extrait les enregistrements qui contiennent cette orthographe spécifique du mot. Le fait qu’un enregistrement contienne une seule ou bien une centaine d’instances du mot n’a aucun impact sur les résultats. En revanche, Recherche SharePoint Server renvoie une valeur de pertinence associée aux documents correspondants. La pertinence des documents ayant « programme » dans le titre est plus élevée que pour ceux qui contiennent le mot uniquement dans leur dernier paragraphe. De même, une correspondance est également établie pour les documents contenant des variations du terme recherché, par exemple « programmes » et « programmation », et ils sont renvoyés par la requête.

Les requêtes de Recherche SharePoint Server renvoient des valeurs de pertinence de type entier dans la colonne nommée « classement ».

En outre :

  • Les valeurs de classement renvoyées par la requête sont des entiers compris entre 0 et 1000.

  • Des valeurs de classement plus élevées indiquent des documents qui correspondent mieux que d'autres aux conditions de la recherche.

  • Les valeurs de classement s'appliquent uniquement à la requête en cours et elles ne peuvent donc pas être comparées pour des résultats d'une requête à l'autre.

  • Les valeurs de classement sont relatives aux autres documents correspondant à la requête. Par conséquent, la valeur de classement d'un document particulier varie selon les autres documents qui correspondent également à la requête.

  • La valeur de classement pour les éléments correspondant à un prédicat purement relationnel est 1 000.

Utilisation de recherches localisées

Recherche SharePoint Server prend en charge entièrement la recherche en Unicode. Vous pouvez indexer des documents qui utilisent Unicode et créer des requêtes de recherche qui utilisent des identificateurs et des littéraux Unicode. Toutefois, le paramètre de langue d’une application ou du système d’exploitation peut avoir des conséquences sur le fonctionnement de Recherche SharePoint Server.

Documents et paramètres régionaux du système

Lorsque le système d’exploitation, ou même une application, est configuré pour utiliser une langue et des paramètres régionaux spécifiques, de nombreux paramètres sont affectés. Ces paramètres incluent le format numérique, le format de date, le format monétaire, le mappage des majuscules et des minuscules, l’ordre de classement du dictionnaire, la création de jetons ainsi que d’autres éléments. Bien que ces paramètres permettent à Recherche SharePoint Server d’offrir une prise en charge d’excellent niveau de la localisation, des résultats inattendus peuvent se produire lorsque des documents conçus avec un paramètre régional donné font l’objet de recherches à l’aide d’un système configuré avec un autre paramètre régional.

Par exemple, la liste de mots parasites (des mots ignorés lors de l'indexation et dans les requêtes, car ils ne donnent aucune signification ou aucun contexte) dans chaque langue est très différente. En allemand, le mot die est équivalent au mot anglais the. Si vous indexez un document en allemand puis que vous recherchez « die » à l'aide d'un système de requête (en anglais), des documents peuvent être renvoyés, même si le mot doit être ignoré. Un système en allemand qui reçoit la même requête va renvoyer une erreur indiquant que la requête de recherche contient seulement des mots parasites.

Lorsque l’objet IFilter traite les propriétés de texte et le contenu d’un document, il signale la langue de ce document à l’indexeur de contenu. En utilisant ces informations, Recherche SharePoint Server peut appliquer l’analyseur lexical approprié ainsi que la liste des mots parasites.

Spécification de langues

Vous pouvez spécifier la langue utilisée dans les requêtes de recherche. Les deux prédicats FREETEXT et CONTAINS de la clause WHERE prennent en charge la spécification d'une langue. Vous pouvez indiquer la langue de la requête en fournissant un identificateur numérique des paramètres régionaux (LCID) dans le prédicat CONTAINS ou FREETEXT, en utilisant la syntaxe suivante :

CONTAINS | FREETEXT

([<column_identifier>,]'<content_search_condition>' [,LCID])

Pour plus d'informations, voir la syntaxe pour les prédicats CONTAINS et FREETEXT.

Dans cette section

Extensions SQL dans la recherche SharePoint

Fonctionnalités SQL non disponibles dans la recherche SharePoint

Modifications dans la syntaxe SQL par rapport à SharePoint Portal Server 2003

Voir aussi

Concepts

Référence de la syntaxe SQL SharePoint Search

Référence de syntaxe de requête par mots clés

Référence de la syntaxe du langage de requête FQL (FAST Query Language)

Architecture d’interrogation de la recherche de contenu d’entreprise