MicrosoftLanguageTokenizer Construtores
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Sobrecargas
MicrosoftLanguageTokenizer() |
Inicializa uma nova instância da classe MicrosoftLanguageTokenizer. |
MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>) |
Inicializa uma nova instância da classe MicrosoftLanguageTokenizer. |
MicrosoftLanguageTokenizer()
Inicializa uma nova instância da classe MicrosoftLanguageTokenizer.
public MicrosoftLanguageTokenizer ();
Public Sub New ()
Aplica-se a
MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)
Inicializa uma nova instância da classe MicrosoftLanguageTokenizer.
public MicrosoftLanguageTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftTokenizerLanguage) = Nothing)
Parâmetros
- name
- String
O nome do tokenizer. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.
O comprimento máximo do token. Tokens maiores do que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.
Um valor que indica como o tokenizer é usado. Defina como true se usado como o tokenizador de pesquisa, defina como false se usado como o tokenizador de indexação. O padrão é false.
- language
- Nullable<MicrosoftTokenizerLanguage>
O idioma a ser usado. O padrão é inglês. Os valores possíveis incluem: 'bangla', 'búlgaro', 'catalão', 'chinêsSimplified', 'chineseTraditional', 'croata', 'tcheco', 'dinamarquês', 'holandês', 'inglês', 'francês', 'alemão', 'grego', 'gujarati', 'hindi', 'islandês', 'indonésio', 'italiano', 'japonês', 'kannada', 'coreano', 'malaio', 'malaia', 'marathi', 'norwegianBokmaal', 'polonês', 'português', 'portuguêsbrazilo', 'punjabi', 'romeno', 'russo', 'sérvioCyrillic', 'sérvioLatin', 'esloveno', 'espanhol', 'sueco', 'tâmil', ' telugu', 'thai', 'ucraniano', 'urdu', 'vietnamita'
Aplica-se a
Azure SDK for .NET