Compartilhar via


PatternTokenizer interface

Tokenizer que usa a correspondência de padrões regex para construir tokens distintos. Esse tokenizer é implementado usando o Apache Lucene.

Propriedades

flags

Sinalizadores de expressão regulares. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

group

O ordinal baseado em zero do grupo correspondente no padrão de expressão regular a ser extraído em tokens. Use -1 se quiser usar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. O padrão é -1. Valor padrão: -1.

name

O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

odatatype

Discriminatório Polimórfico

pattern

Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+.

Detalhes da propriedade

flags

Sinalizadores de expressão regulares. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Valor da propriedade

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

group

O ordinal baseado em zero do grupo correspondente no padrão de expressão regular a ser extraído em tokens. Use -1 se quiser usar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. O padrão é -1. Valor padrão: -1.

group?: number

Valor da propriedade

number

name

O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor da propriedade

string

odatatype

Discriminatório Polimórfico

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Valor da propriedade

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+.

pattern?: string

Valor da propriedade

string