Freigeben über


MicrosoftLanguageStemmingTokenizer Klasse

Definition

Teilt Text nach sprachspezifischen Regeln auf und reduziert Wörter auf deren Grundformen.

public class MicrosoftLanguageStemmingTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type MicrosoftLanguageStemmingTokenizer = class
    inherit LexicalTokenizer
Public Class MicrosoftLanguageStemmingTokenizer
Inherits LexicalTokenizer
Vererbung
MicrosoftLanguageStemmingTokenizer

Konstruktoren

MicrosoftLanguageStemmingTokenizer(String)

Initialisiert eine neue instance von MicrosoftLanguageStemmingTokenizer.

Eigenschaften

IsSearchTokenizer

Ein -Wert, der angibt, wie der Tokenizer verwendet wird. Legen Sie bei Verwendung als Suchtokenizer auf TRUE fest, und legen Sie auf false fest, wenn sie als Indizierungstokenizer verwendet wird. Der Standardwert ist "false".

Language

Die zu verwendende Sprache. Der Standardwert ist Englisch.

MaxTokenLength

Die maximale Tokenlänge. Token, die die maximale Länge überschreiten, werden geteilt. Ein Token darf maximal 300 Zeichen lang sein. Token, die länger als 300 Zeichen sind, werden zunächst in Token mit der Länge 300 aufgeteilt, und dann wird jedes dieser Token basierend auf der maximalen Tokenlänge aufgeteilt. Der Standardwert ist 255.

Name

Der Name des Tokenizers. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

(Geerbt von LexicalTokenizer)

Gilt für: