DictionaryDecompounderTokenFilter interface
많은 게르만어파에 있는 복합 단어를 분해합니다. 이 토큰 필터는 Apache Lucene을 사용하여 구현됩니다.
- Extends
속성
max |
최대 하위 단어 크기입니다. 이보다 짧은 하위 단어만 출력됩니다. 기본값은 15입니다. 최대값은 300입니다. |
min |
최소 하위 단어 크기입니다. 이보다 긴 하위 단어만 출력됩니다. 기본값은 2입니다. 최대값은 300입니다. |
min |
최소 단어 크기입니다. 이보다 긴 단어만 처리됩니다. 기본값은 5입니다. 최대값은 300입니다. |
odatatype | 이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자 |
only |
출력에 가장 긴 일치 하위 단어만 추가할지 여부를 나타내는 값입니다. 기본값은 false입니다. |
word |
일치시킬 단어 목록입니다. |
상속된 속성
name | 토큰 필터의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다. |
속성 세부 정보
maxSubwordSize
최대 하위 단어 크기입니다. 이보다 짧은 하위 단어만 출력됩니다. 기본값은 15입니다. 최대값은 300입니다.
maxSubwordSize?: number
속성 값
number
minSubwordSize
최소 하위 단어 크기입니다. 이보다 긴 하위 단어만 출력됩니다. 기본값은 2입니다. 최대값은 300입니다.
minSubwordSize?: number
속성 값
number
minWordSize
최소 단어 크기입니다. 이보다 긴 단어만 처리됩니다. 기본값은 5입니다. 최대값은 300입니다.
minWordSize?: number
속성 값
number
odatatype
이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자
odatatype: "#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
속성 값
"#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"
onlyLongestMatch
출력에 가장 긴 일치 하위 단어만 추가할지 여부를 나타내는 값입니다. 기본값은 false입니다.
onlyLongestMatch?: boolean
속성 값
boolean
wordList
일치시킬 단어 목록입니다.
wordList: string[]
속성 값
string[]