MicrosoftLanguageTokenizer Klasse

Referenz

Definition

Namespace:: Azure.Search.Documents.Indexes.Models

Assembly:: Azure.Search.Documents.dll

Paket:: Azure.Search.Documents v11.5.0

Paket:: Azure.Search.Documents v11.5.0-beta.5

Wichtig

Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.

Teilt Text mit sprachspezifische Regeln auf.

public class MicrosoftLanguageTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer

type MicrosoftLanguageTokenizer = class
    inherit LexicalTokenizer

Public Class MicrosoftLanguageTokenizer
Inherits LexicalTokenizer

Vererbung: Object

LexicalTokenizer
MicrosoftLanguageTokenizer

Konstruktoren

MicrosoftLanguageTokenizer(String)

Initialisiert eine neue instance von MicrosoftLanguageTokenizer.

Eigenschaften

IsSearchTokenizer	Ein -Wert, der angibt, wie der Tokenizer verwendet wird. Legen Sie bei Verwendung als Suchtokenizer auf TRUE fest, und legen Sie auf false fest, wenn sie als Indizierungstokenizer verwendet wird. Der Standardwert ist "false".
Language	Die zu verwendende Sprache. Der Standardwert ist Englisch.
MaxTokenLength	Die maximale Tokenlänge. Token, die die maximale Länge überschreiten, werden geteilt. Ein Token darf maximal 300 Zeichen lang sein. Token, die länger als 300 Zeichen sind, werden zunächst in Token mit der Länge 300 aufgeteilt, und dann wird jedes dieser Token basierend auf der maximalen Tokenlänge aufgeteilt. Der Standardwert ist 255.
Name	Der Name des Tokenizers. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. (Geerbt von LexicalTokenizer)

Gilt für:

Freigeben über

MicrosoftLanguageTokenizer Klasse

Definition

Konstruktoren

Eigenschaften

Gilt für:

Feedback

Zusätzliche Ressourcen