LuceneStandardTokenizer interface
Unicode Metin Segmentasyonu kurallarını izleyerek metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Özellikler
max |
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. Varsayılan değer: 255. |
name | Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
odatatype | Polimorfik Ayrımcı |
Özellik Ayrıntıları
maxTokenLength
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. Varsayılan değer: 255.
maxTokenLength?: number
Özellik Değeri
number
name
Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.
name: string
Özellik Değeri
string
odatatype
Polimorfik Ayrımcı
odatatype: "#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"
Özellik Değeri
"#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"