PatternTokenizer interface
Tokenizer que usa a correspondência de padrões regex para construir tokens distintos. Esse tokenizer é implementado usando o Apache Lucene.
Propriedades
flags | Sinalizadores de expressão regulares. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES' |
group | O ordinal baseado em zero do grupo correspondente no padrão de expressão regular a ser extraído em tokens. Use -1 se quiser usar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. O padrão é -1. Valor padrão: -1. |
name | O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres. |
odatatype | Discriminatório Polimórfico |
pattern | Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: |
Detalhes da propriedade
flags
Sinalizadores de expressão regulares. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Valor da propriedade
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
O ordinal baseado em zero do grupo correspondente no padrão de expressão regular a ser extraído em tokens. Use -1 se quiser usar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. O padrão é -1. Valor padrão: -1.
group?: number
Valor da propriedade
number
name
O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.
name: string
Valor da propriedade
string
odatatype
Discriminatório Polimórfico
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
Valor da propriedade
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+
.
pattern?: string
Valor da propriedade
string