WordDelimiterTokenFilter interface
Unterteilt Wörter in Teilwörter und führt optionale Transformationen in Teilwortgruppen durch. Dieser Tokenfilter wird mit Apache Lucene implementiert.
- Extends
Eigenschaften
catenate |
Ein -Wert, der angibt, ob alle Teilwortteile kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search-1" zu "AzureSearch1". Der Standardwert ist "false". |
catenate |
Ein -Wert, der angibt, ob maximale Ausführungen von Zahlenteilen kategorisiert werden. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "1-2" zu "12". Der Standardwert ist "false". |
catenate |
Ein -Wert, der angibt, ob maximale Ausführungen von Wortteilen kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search" zu "AzureSearch". Der Standardwert ist "false". |
generate |
Ein -Wert, der angibt, ob Zahlenunterwörter generiert werden sollen. Der Standardwert ist "true". |
generate |
Ein -Wert, der angibt, ob Teilwörter generiert werden sollen. Wenn festgelegt, werden Teile von Wörtern generiert; beispielsweise wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true". |
odatatype | Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann |
preserve |
Ein -Wert, der angibt, ob ursprüngliche Wörter beibehalten und der Unterwortliste hinzugefügt werden. Der Standardwert ist "false". |
protected |
Eine Liste der Token, die vor dem Trennen geschützt werden sollen. |
split |
Ein -Wert, der angibt, ob Wörter in caseChange aufgeteilt werden sollen. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true". |
split |
Ein Wert, der angibt, ob auf Zahlen aufgeteilt werden soll. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure1Search" zu "Azure" "1" "Search". Der Standardwert ist "true". |
stem |
Ein Wert, der angibt, ob nachfolgende "'s" für jedes Unterwort entfernt werden sollen. Der Standardwert ist "true". |
Geerbte Eigenschaften
name | Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. |
Details zur Eigenschaft
catenateAll
Ein -Wert, der angibt, ob alle Teilwortteile kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search-1" zu "AzureSearch1". Der Standardwert ist "false".
catenateAll?: boolean
Eigenschaftswert
boolean
catenateNumbers
Ein -Wert, der angibt, ob maximale Ausführungen von Zahlenteilen kategorisiert werden. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "1-2" zu "12". Der Standardwert ist "false".
catenateNumbers?: boolean
Eigenschaftswert
boolean
catenateWords
Ein -Wert, der angibt, ob maximale Ausführungen von Wortteilen kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search" zu "AzureSearch". Der Standardwert ist "false".
catenateWords?: boolean
Eigenschaftswert
boolean
generateNumberParts
Ein -Wert, der angibt, ob Zahlenunterwörter generiert werden sollen. Der Standardwert ist "true".
generateNumberParts?: boolean
Eigenschaftswert
boolean
generateWordParts
Ein -Wert, der angibt, ob Teilwörter generiert werden sollen. Wenn festgelegt, werden Teile von Wörtern generiert; beispielsweise wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true".
generateWordParts?: boolean
Eigenschaftswert
boolean
odatatype
Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"
Eigenschaftswert
"#Microsoft.Azure.Search.WordDelimiterTokenFilter"
preserveOriginal
Ein -Wert, der angibt, ob ursprüngliche Wörter beibehalten und der Unterwortliste hinzugefügt werden. Der Standardwert ist "false".
preserveOriginal?: boolean
Eigenschaftswert
boolean
protectedWords
Eine Liste der Token, die vor dem Trennen geschützt werden sollen.
protectedWords?: string[]
Eigenschaftswert
string[]
splitOnCaseChange
Ein -Wert, der angibt, ob Wörter in caseChange aufgeteilt werden sollen. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true".
splitOnCaseChange?: boolean
Eigenschaftswert
boolean
splitOnNumerics
Ein Wert, der angibt, ob auf Zahlen aufgeteilt werden soll. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure1Search" zu "Azure" "1" "Search". Der Standardwert ist "true".
splitOnNumerics?: boolean
Eigenschaftswert
boolean
stemEnglishPossessive
Ein Wert, der angibt, ob nachfolgende "'s" für jedes Unterwort entfernt werden sollen. Der Standardwert ist "true".
stemEnglishPossessive?: boolean
Eigenschaftswert
boolean
Geerbte Eigenschaftsdetails
name
Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.
name: string
Eigenschaftswert
string
Geerbt vonBaseTokenFilter.name