Compartilhar via


NGramTokenizer interface

Cria tokens de entrada em n-gramas de determinados tamanhos. Esse criador de tokens é implementado usando o Apache Lucene.

Extends

Propriedades

maxGram

O comprimento máximo de n-grama. O padrão é 2. O máximo é 300.

minGram

O comprimento mínimo de n-grama. O padrão é UTF-1. O máximo é 300. Deve ser menor que o valor de maxGram.

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

tokenChars

Classes de caracteres a serem mantidas nos tokens.

Propriedades herdadas

name

O nome do criador de tokens. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

Detalhes da propriedade

maxGram

O comprimento máximo de n-grama. O padrão é 2. O máximo é 300.

maxGram?: number

Valor da propriedade

number

minGram

O comprimento mínimo de n-grama. O padrão é UTF-1. O máximo é 300. Deve ser menor que o valor de maxGram.

minGram?: number

Valor da propriedade

number

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

Valor da propriedade

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

Classes de caracteres a serem mantidas nos tokens.

tokenChars?: TokenCharacterKind[]

Valor da propriedade

Detalhes das propriedades herdadas

name

O nome do criador de tokens. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor da propriedade

string

Herdado deBaseLexicalTokenizer.name