WordDelimiterTokenFilter interface

Referenz

Paket:: @azure/search-documents

Unterteilt Wörter in Teilwörter und führt optionale Transformationen in Teilwortgruppen durch. Dieser Tokenfilter wird mit Apache Lucene implementiert.

Extends: BaseTokenFilter

Eigenschaften

catenateAll	Ein -Wert, der angibt, ob alle Teilwortteile kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search-1" zu "AzureSearch1". Der Standardwert ist "false".
catenateNumbers	Ein -Wert, der angibt, ob maximale Ausführungen von Zahlenteilen kategorisiert werden. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "1-2" zu "12". Der Standardwert ist "false".
catenateWords	Ein -Wert, der angibt, ob maximale Ausführungen von Wortteilen kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search" zu "AzureSearch". Der Standardwert ist "false".
generateNumberParts	Ein -Wert, der angibt, ob Zahlenunterwörter generiert werden sollen. Der Standardwert ist "true".
generateWordParts	Ein -Wert, der angibt, ob Teilwörter generiert werden sollen. Wenn festgelegt, werden Teile von Wörtern generiert; beispielsweise wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true".
odatatype	Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
preserveOriginal	Ein -Wert, der angibt, ob ursprüngliche Wörter beibehalten und der Unterwortliste hinzugefügt werden. Der Standardwert ist "false".
protectedWords	Eine Liste der Token, die vor dem Trennen geschützt werden sollen.
splitOnCaseChange	Ein -Wert, der angibt, ob Wörter in caseChange aufgeteilt werden sollen. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true".
splitOnNumerics	Ein Wert, der angibt, ob auf Zahlen aufgeteilt werden soll. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure1Search" zu "Azure" "1" "Search". Der Standardwert ist "true".
stemEnglishPossessive	Ein Wert, der angibt, ob nachfolgende "'s" für jedes Unterwort entfernt werden sollen. Der Standardwert ist "true".

Geerbte Eigenschaften

name	Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

Details zur Eigenschaft

catenateAll

Ein -Wert, der angibt, ob alle Teilwortteile kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search-1" zu "AzureSearch1". Der Standardwert ist "false".

catenateAll?: boolean

Eigenschaftswert

boolean

catenateNumbers

Ein -Wert, der angibt, ob maximale Ausführungen von Zahlenteilen kategorisiert werden. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "1-2" zu "12". Der Standardwert ist "false".

catenateNumbers?: boolean

Eigenschaftswert

boolean

catenateWords

Ein -Wert, der angibt, ob maximale Ausführungen von Wortteilen kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search" zu "AzureSearch". Der Standardwert ist "false".

catenateWords?: boolean

Eigenschaftswert

boolean

generateNumberParts

Ein -Wert, der angibt, ob Zahlenunterwörter generiert werden sollen. Der Standardwert ist "true".

generateNumberParts?: boolean

Eigenschaftswert

boolean

generateWordParts

Ein -Wert, der angibt, ob Teilwörter generiert werden sollen. Wenn festgelegt, werden Teile von Wörtern generiert; beispielsweise wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true".

generateWordParts?: boolean

Eigenschaftswert

boolean

odatatype

Polymorpher Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"

Eigenschaftswert

"#Microsoft.Azure.Search.WordDelimiterTokenFilter"

preserveOriginal

Ein -Wert, der angibt, ob ursprüngliche Wörter beibehalten und der Unterwortliste hinzugefügt werden. Der Standardwert ist "false".

preserveOriginal?: boolean

Eigenschaftswert

boolean

protectedWords

Eine Liste der Token, die vor dem Trennen geschützt werden sollen.

protectedWords?: string[]

Eigenschaftswert

string[]

splitOnCaseChange

Ein -Wert, der angibt, ob Wörter in caseChange aufgeteilt werden sollen. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true".

splitOnCaseChange?: boolean

Eigenschaftswert

boolean

splitOnNumerics

Ein Wert, der angibt, ob auf Zahlen aufgeteilt werden soll. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure1Search" zu "Azure" "1" "Search". Der Standardwert ist "true".

splitOnNumerics?: boolean

Eigenschaftswert

boolean

stemEnglishPossessive

Ein Wert, der angibt, ob nachfolgende "'s" für jedes Unterwort entfernt werden sollen. Der Standardwert ist "true".

stemEnglishPossessive?: boolean

Eigenschaftswert

boolean

Geerbte Eigenschaftsdetails

name

Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

name: string

Eigenschaftswert

string

Geerbt vonBaseTokenFilter.name

Freigeben über

WordDelimiterTokenFilter interface

Eigenschaften

Geerbte Eigenschaften

Details zur Eigenschaft

catenateAll

Eigenschaftswert

catenateNumbers

Eigenschaftswert

catenateWords

Eigenschaftswert

generateNumberParts

Eigenschaftswert

generateWordParts

Eigenschaftswert

odatatype

Eigenschaftswert

preserveOriginal

Eigenschaftswert

protectedWords

Eigenschaftswert

splitOnCaseChange

Eigenschaftswert

splitOnNumerics

Eigenschaftswert

stemEnglishPossessive

Eigenschaftswert

Geerbte Eigenschaftsdetails

name

Eigenschaftswert

Zusätzliche Ressourcen