Aracılığıyla paylaş


LuceneStandardTokenizer interface

Unicode Metin Segmentasyonu kurallarını izleyerek metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Özellikler

maxTokenLength

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. Varsayılan değer: 255.

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

odatatype

Polimorfik Ayrımcı

Özellik Ayrıntıları

maxTokenLength

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. Varsayılan değer: 255.

maxTokenLength?: number

Özellik Değeri

number

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

name: string

Özellik Değeri

string

odatatype

Polimorfik Ayrımcı

odatatype: "#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"

Özellik Değeri

"#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"