Partager via


PatternTokenizer Classe

Définition

Tokenizer qui utilise la correspondance de modèle regex pour construire des jetons distincts. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

public class PatternTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type PatternTokenizer = class
    inherit LexicalTokenizer
Public Class PatternTokenizer
Inherits LexicalTokenizer
Héritage
PatternTokenizer

Constructeurs

PatternTokenizer(String)

Initialise une nouvelle instance de PatternTokenizer.

Propriétés

Flags

Indicateurs d’expression régulière pour Pattern.

Group

Ordinal de base zéro du groupe correspondant dans le modèle d’expression régulière à extraire en jetons. Utilisez -1 si vous souhaitez utiliser le modèle entier pour fractionner l’entrée en jetons, quels que soient les groupes correspondants. La valeur par défaut est -1.

Name

Nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères.

(Hérité de LexicalTokenizer)
Pattern

Modèle d’expression régulière pour faire correspondre les séparateurs de jetons. La valeur par défaut est une expression qui correspond à un ou plusieurs caractères autres que les mots.

S’applique à