PatternTokenizer interface
Tokenizer que utiliza a correspondência de padrões regex para construir tokens distintos. Este tokenizador é implementado com o Apache Lucene.
Propriedades
flags | Sinalizadores de expressão regulares. Os valores possíveis incluem: "CANON_EQ", "CASE_INSENSITIVE", "COMENTÁRIOS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES" |
group | O ordinal baseado em zero do grupo correspondente no padrão de expressão regular para extrair em tokens. Utilize -1 se quiser utilizar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. A predefinição é -1. Valor predefinido: -1. |
name | O nome do tokenizer. Só tem de conter letras, dígitos, espaços, travessões ou carateres de sublinhado, só pode começar e terminar com carateres alfanuméricos e está limitado a 128 carateres. |
odatatype | Discriminador Polimórfico |
pattern | Um padrão de expressão regular para corresponder aos separadores de tokens. A predefinição é uma expressão que corresponde a um ou mais carateres de espaço em branco. Valor predefinido: |
Detalhes de Propriedade
flags
Sinalizadores de expressão regulares. Os valores possíveis incluem: "CANON_EQ", "CASE_INSENSITIVE", "COMENTÁRIOS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Valor de Propriedade
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
O ordinal baseado em zero do grupo correspondente no padrão de expressão regular para extrair em tokens. Utilize -1 se quiser utilizar todo o padrão para dividir a entrada em tokens, independentemente dos grupos correspondentes. A predefinição é -1. Valor predefinido: -1.
group?: number
Valor de Propriedade
number
name
O nome do tokenizer. Só tem de conter letras, dígitos, espaços, travessões ou carateres de sublinhado, só pode começar e terminar com carateres alfanuméricos e está limitado a 128 carateres.
name: string
Valor de Propriedade
string
odatatype
Discriminador Polimórfico
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
Valor de Propriedade
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
Um padrão de expressão regular para corresponder aos separadores de tokens. A predefinição é uma expressão que corresponde a um ou mais carateres de espaço em branco. Valor predefinido: \W+
.
pattern?: string
Valor de Propriedade
string