PatternTokenizer Klasse
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Tokenizer, der regex-Musterabgleich verwendet, um unterschiedliche Token zu erstellen. Dieser Tokenizer wird mithilfe von Apache Lucene implementiert.
public class PatternTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type PatternTokenizer = class
inherit LexicalTokenizer
Public Class PatternTokenizer
Inherits LexicalTokenizer
- Vererbung
Konstruktoren
PatternTokenizer(String) |
Initialisiert eine neue instance von PatternTokenizer. |
Eigenschaften
Flags |
Flags für reguläre Ausdrücke für Pattern. |
Group |
Die nullbasierte Ordnungszahl der übereinstimmenden Gruppe im Muster für reguläre Ausdrücke, die in Token extrahiert werden soll. Verwenden Sie -1, wenn Sie das gesamte Muster verwenden möchten, um die Eingabe unabhängig von übereinstimmenden Gruppen in Token aufzuteilen. Der Standardwert ist -1. |
Name |
Der Name des Tokenizers. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. (Geerbt von LexicalTokenizer) |
Pattern |
Ein Muster für reguläre Ausdrücke zum Abgleichen von Tokentrennzeichen. Der Standardwert ist ein Ausdruck, der einem oder mehreren Nicht-Wortzeichen entspricht. |