Informations sur le langage de requête SQL de la recherche de contenu d'entreprise
Recherche de contenu d'entreprise dans Microsoft Office SharePoint Server 2007 fournit des fonctionnalités d'analyse et de recherche qui prennent en charge la recherche de texte intégral. Le langage de requête utilisé par la Recherche de contenu d'entreprise étend la syntaxe des requêtes de base de données SQL-92 et SQL-99 standard en améliorant son utilisation avec des recherches de texte intégral.
Identificateurs
Les identificateurs spécifient les noms des colonnes (parfois appelés propriétés), les catalogues et les alias. En revanche, les littéraux spécifient des valeurs numériques et des valeurs de chaîne.
Vous pouvez créer des identificateurs d'une longueur maximale de 128 caractères et, dans l'un des deux types, caractérisés par les caractères utilisés dans le nom de l'identificateur :
**Identificateurs littéraux **Contiennent seulement les caractères A-Z, a-z, 0-9 et le trait de soulignement, et commencent par une lettre. Il ne faut pas les placer entre des guillemets doubles.
Identificateurs délimités Peuvent contenir n'importe quel caractère Unicode valide et doivent être placés entre des guillemets doubles.
Les identificateurs que vous créez en tant qu'URN (Uniform Resource Name) doivent contenir des caractères spéciaux, sont toujours des identificateurs délimités et doivent être placés entre des guillemets doubles.
Notes
Vous pouvez utiliser l'astérisque (*) en tant qu'identificateur spécial de colonne lorsque vous souhaitez spécifier que la Recherche de contenu d'entreprise inclut l'ensemble des propriétés indexées de la requête. Bien que ce ne soit pas un identificateur littéral, il ne nécessite pas de guillemets doubles.
Littéraux
Un littéral est une chaîne de caractères qui représente une valeur dans une instruction de requête. Vous utilisez des littéraux pour comparer des valeurs de colonne ou pour spécifier des termes recherchés. Recherche de contenu d'entreprise dans Microsoft Office SharePoint Server 2007 prend en charge les types de littéraux suivants.
Chaîne
Les littéraux de chaîne ne sont pas limités en longueur et ils peuvent contenir des caractères ANSI (American National Standard Institute) ou Unicode. Vous devez placer les littéraux de chaîne entre des guillemets simples. Pour inclure un guillemet simple à l'intérieur d'un littéral de chaîne, utilisez deux guillemets simples. Représentez une chaîne vide sous la forme de deux guillemets simples consécutifs ('').
Numérique
Les littéraux numériques représentent des nombres, y compris des entiers positifs et négatifs, des nombres décimaux et des valeurs monétaires, et ils peuvent contenir les chiffres 0-9, un point et la lettre E (ou e). Vous pouvez définir des littéraux numériques à l'aide de la notation scientifique (par exemple, 2,3E-05). Ne placez pas un littéral numérique entre des guillemets simples, sinon il sera interprété en tant que littéral de chaîne et comparé à l'aide des techniques de comparaison de chaîne. Les valeurs monétaires ne peuvent pas contenir de symboles de devise.
Hexadécimal
Un littéral hexadécimal représente un entier non signé spécifié dans la notation hexadécimale ; il peut contenir les chiffres 0-9 et les lettres A-F et a-f. Les littéraux hexadécimaux doivent commencer par 0x.
Notes
Le standard SQL-92 requiert que les littéraux hexadécimaux soient placés entre des guillemets simples ; cependant, la Recherche de contenu d'entreprise ne prend pas en charge cette notation.
Booléen
Les littéraux booléens représentent des valeurs logiques et peuvent avoir la valeur TRUE ou FALSE. Ne placez pas un littéral booléen entre des guillemets simples, sinon il sera interprété en tant que littéral de chaîne.
Date
Les littéraux de date représentent des dates spécifiques, des horodatages ou des dates/heures relatives, et sont entourées de guillemets simples. Vous devez spécifier les dates sous la forme année/mois/jour ou année-mois-jour, où les mois, le jour et l'année sont des nombres. Spécifiez l'année avec une valeur à quatre chiffres, par exemple 2004. Les heures doivent être spécifiées sous la forme heures:minutes:secondes. La syntaxe des dates/heures relatives est basée sur la Fonction DateAdd dans la syntaxe SQL de la recherche de contenu d'entreprise.
Respect de la casse
Les requêtes de la Recherche de contenu d'entreprise dans Microsoft Office SharePoint Server 2007 ne respectent pas la casse. Cela inclut les mots clés des requêtes (SELECT est identique à Select, à select et à sELect) et les termes de la recherche. Si un identificateur ou un littéral utilise des caractères Unicode qui ont une sémantique de mappage de casse, le moteur de recherche considère que toutes les casses sont équivalentes.
Non-respect des accents
Les requêtes de la Recherche de contenu d'entreprise ne respectent pas la casse et ne respectent pas non plus les accents lors de l'utilisation du prédicat FREETEXT ou du prédicat CONTAINS. Une recherche pour le terme « Resume » renvoie également les documents qui contiennent « Résumé ». Si un identificateur ou un littéral contient des caractères Unicode accentués, la requête de recherche établit également une correspondance avec des entrées qui contiennent des caractères combinés Unicode utilisant le caractère de base du caractère accentué dans l'identificateur ou le littéral.
Notes
Ce n'est pas le cas pour les plages de caractères 0x2e81-f8ff et 0x1100-0x11ff.
Informations sur les valeurs de pertinence
Lorsqu'ils sont utilisés dans une base de données relationnelle, les lignes qui sont renvoyées par une requête de recherche doivent respecter toutes les conditions spécifiées par la requête. En revanche, une requête de la Recherche de contenu d'entreprise peut renvoyer des documents qui répondent aux conditions de recherche à des degrés divers.
Par exemple, une recherche du terme « programme » dans une base de données relationnelle extrait les enregistrements qui contiennent cette orthographe spécifique du mot. Le fait qu'un enregistrement contienne une seule ou bien une centaine d'instances du mot n'a aucun impact sur les résultats. En revanche, la Recherche de contenu d'entreprise renvoie une valeur de pertinence associée aux documents correspondants. La pertinence des documents ayant « programme » dans le titre est plus élevée que pour ceux qui contiennent le mot uniquement dans leur dernier paragraphe. De même, une correspondance est également établie pour les documents contenant des variations du terme recherché, par exemple « programmes » et « programmation », et ils sont renvoyés par la requête.
Les requêtes de la Recherche de contenu d'entreprise renvoient des valeurs de pertinence de type entier dans la colonne nommée « classement ».
En outre :
Les valeurs de classement renvoyées par la requête sont des entiers compris entre 0 et 1000.
Des valeurs de classement plus élevées indiquent des documents qui correspondent mieux que d'autres aux conditions de la recherche.
Les valeurs de classement s'appliquent uniquement à la requête en cours et elles ne peuvent donc pas être comparées pour des résultats d'une requête à l'autre.
Les valeurs de classement sont relatives aux autres documents correspondant à la requête. Par conséquent, la valeur de classement d'un document particulier varie selon les autres documents qui correspondent également à la requête.
La valeur de classement pour les éléments correspondant à un prédicat purement relationnel est 1 000.
Utilisation de recherches localisées
La Recherche de contenu d'entreprise dans Microsoft Office SharePoint Server 2007 prend en charge entièrement la recherche en Unicode. Vous pouvez indexer des documents qui utilisent Unicode et créer des requêtes de recherche qui utilisent des identificateurs et des littéraux Unicode. Toutefois, le paramètre de langue d'une application ou du système d'exploitation peuvent avoir des effets de bord sur le fonctionnement de la Recherche de contenu d'entreprise.
Documents et paramètres régionaux du système
Lorsque le système d'exploitation, ou même une application, est configuré pour utiliser une langue et des paramètres régionaux spécifiques, de nombreux paramètres sont affectés. Ces paramètres incluent le format numérique, le format de date, le format monétaire, le mappage des majuscules et des minuscules, l'ordre de classement du dictionnaire, la création de jetons ainsi que d'autres éléments. Bien que ces paramètres permettent à la Recherche de contenu d'entreprise d'offrir une prise en charge d'excellent niveau de la localisation, des résultats inattendus peuvent se produire lorsque des documents conçus avec un paramètre régional donné font l'objet de recherches à l'aide d'un système configuré avec un autre paramètre régional.
Par exemple, la liste de mots parasites (des mots ignorés lors de l'indexation et dans les requêtes, car ils ne donnent aucune signification ou aucun contexte) dans chaque langue est très différente. En allemand, le mot die est équivalent au mot anglais the. Si vous indexez un document en allemand puis que vous recherchez « die » à l'aide d'un système de requête (en anglais), des documents peuvent être renvoyés, même si le mot doit être ignoré. Un système en allemand qui reçoit la même requête va renvoyer une erreur indiquant que la requête de recherche contient seulement des mots parasites.
Lorsque l'objet IFilter traite les propriétés de texte et le contenu d'un document, il signale la langue de ce document à l'indexeur de contenu. En utilisant ces informations, la Recherche de contenu d'entreprise peut appliquer le séparateur de mots approprié ainsi que la liste des mots parasites.
Spécification de langues
Vous pouvez spécifier la langue utilisée dans les requêtes de recherche. Les deux prédicats FREETEXT et CONTAINS de la clause WHERE prennent en charge la spécification d'une langue. Vous pouvez indiquer la langue de la requête en fournissant un identificateur numérique des paramètres régionaux (LCID) dans le prédicat CONTAINS ou FREETEXT, en utilisant la syntaxe suivante :
CONTAINS | FREETEXT
([<column_identifier>,]'<content_search_condition>' [,LCID])
Pour plus d'informations, voir la syntaxe pour les prédicats CONTAINS et FREETEXT.
Dans cette section
Extensions SQL dans la recherche de contenu d'entreprise
Fonctionnalités SQL non disponibles dans la recherche de contenu d'entreprise
Modifications dans la syntaxe SQL par rapport à SharePoint Portal Server 2003
Voir aussi
Autres ressources
Référence de la syntaxe SQL de recherche de contenu d'entreprise
Référence de syntaxe de mots-clés Recherche de contenu d'entreprise
Référence de syntaxe pour les URL de Recherche de contenu d'entreprise
Vue d'ensemble du modèle objet de requête de la recherche de contenu d'entreprise
Vue d'ensemble du service Web Query de recherche de contenu d'entreprise