Freigeben über


NGramTokenizer Klasse

Definition

Tokenisiert die Eingabe in N-Gramme einer festgelegten Größe. Dieser Tokenizer wird mithilfe von Apache Lucene implementiert. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.NGramTokenizer")]
public class NGramTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.NGramTokenizer")>]
type NGramTokenizer = class
    inherit Tokenizer
Public Class NGramTokenizer
Inherits Tokenizer
Vererbung
NGramTokenizer
Attribute
Newtonsoft.Json.JsonObjectAttribute

Konstruktoren

NGramTokenizer()

Initialisiert eine neue instance der NGramTokenizer-Klasse.

NGramTokenizer(String, Nullable<Int32>, Nullable<Int32>, IList<TokenCharacterKind>)

Initialisiert eine neue instance der NGramTokenizer-Klasse.

Eigenschaften

MaxGram

Ruft die maximale Länge von n-Gramm ab oder legt diese fest. Standard ist 2. Maximum ist 300.

MinGram

Ruft die Mindestlänge von n-Gramm ab oder legt diese fest. Der Standardwert ist 1. Maximum ist 300. Muss kleiner als der Wert von maxGram sein.

Name

Ruft den Namen des Tokenizers ab oder legt den Namen fest. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

(Geerbt von Tokenizer)
TokenChars

Ruft Zeichenklassen ab, die in den Token beibehalten werden sollen, oder legt sie fest.

Methoden

Validate()

Überprüfen Sie das Objekt.

Gilt für: