Apostrophe
|
Supprime tous les caractères suivant une apostrophe (y compris l’apostrophe elle-même). Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html.
|
ArabicNormalization
|
Un filtre de jetons qui applique le normaliseur arabe pour normaliser l’orthographe. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html.
|
AsciiFolding
|
Convertit les caractères Unicode alphabétiques, numériques et symboliques qui ne figurent pas dans les 127 premiers caractères ASCII (le bloc Unicode « latin de base ») en équivalents ASCII, si de tels équivalents existent. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html.
|
CjkBigram
|
Forme des bigrams de termes CJK générés à partir du générateur de jetons standard. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html.
|
CjkWidth
|
Normalise les différences de largeur de CJC. Plie les variantes ASCII fullwidth dans le latin de base équivalent et les variantes katakana demi-largeur dans le Kana équivalent. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html.
|
Classic
|
Supprime les possessifs en anglais et les points des acronymes. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html.
|
CommonGram
|
Construit des digrammes pour les termes d’occurrence fréquente lors de l’indexation. Les termes uniques sont néanmoins aussi indexés, avec des digrammes superposés. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html.
|
EdgeNGram
|
Génère n-grammes de la ou des tailles données à partir de l’avant ou de l’arrière d’un jeton d’entrée. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html.
|
Elision
|
Supprime les élisions. Par exemple, « l’avion » (l’avion) sera converti en « avion ». Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html.
|
GermanNormalization
|
Normalise les caractères allemands selon l’heuristique de l’algorithme de boule de neige German2. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html.
|
HindiNormalization
|
Normalise le texte dans Hindi de façon à supprimer des différences dans les variations orthographiques. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html.
|
IndicNormalization
|
Normalise la représentation Unicode du texte dans les langues indiennes. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html.
|
KeywordRepeat
|
Émet chaque jeton entrant deux fois, une fois en tant que mot clé et une fois en tant que jeton non mot clé. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html.
|
KStem
|
Un filtre kstem à hautes performances pour l’anglais. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html.
|
Length
|
Supprime les mots qui sont trop longs ou trop courts. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html.
|
Limit
|
Limite le nombre de jetons lors de l’indexation. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html.
|
Lowercase
|
Normalise le texte des jetons en minuscules. Consultez https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html.
|
NGram
|
Génère des n-grammes de la taille donnée. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html.
|
PersianNormalization
|
Applique la normalisation pour le persan. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html.
|
Phonetic
|
Crée des jetons pour les correspondances phonétiques. Consultez https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html.
|
PorterStem
|
Utilise l’algorithme de chiffrement Porter pour transformer le flux de jetons. Consultez http://tartarus.org/~martin/PorterStemmer.
|
Reverse
|
Inverse la chaîne des jetons. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html.
|
ScandinavianFoldingNormalization
|
Convertit les caractères scandinaves åÅäæÄÆ->a et öÖøØ->o. Il identifie aussi l’utilisation des voyelles doubles aa, ae, ao, oe et oo, et conserve seulement la première voyelle. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html.
|
ScandinavianNormalization
|
Normalise l’utilisation des caractères scandinaves interchangeables. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html.
|
Shingle
|
Crée des combinaisons de jetons sous la forme d’un unique jeton. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html.
|
Snowball
|
Filtre qui permet d’endiguer les mots à l’aide d’un stemmer généré par Snowball. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html.
|
SoraniNormalization
|
Normalise la représentation Unicode du texte en sorani. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html.
|
Stemmer
|
Filtre de stemming spécifique au langage. Consultez https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters.
|
Stopwords
|
Supprime les mots vides d’un flux de jetons. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html.
|
Trim
|
Supprime les espaces de début et de fin des jetons. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html.
|
Truncate
|
Tronque les termes à une longueur spécifique. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html.
|
Unique
|
Élimine les jetons avec le même texte que le jeton précédent. Consultez http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html.
|
Uppercase
|
Normalise le texte des jetons en majuscules. Consultez https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html.
|
WordDelimiter
|
Divise les mots en sous-mots et effectue des transformations facultatives sur les groupes de sous-mots.
|