다음을 통해 공유


DictionaryDecompounderTokenFilter interface

많은 게르만어파에 있는 복합 단어를 분해합니다. 이 토큰 필터는 Apache Lucene을 사용하여 구현됩니다.

Extends

속성

maxSubwordSize

최대 하위 단어 크기입니다. 이보다 짧은 하위 단어만 출력됩니다. 기본값은 15입니다. 최대값은 300입니다.

minSubwordSize

최소 하위 단어 크기입니다. 이보다 긴 하위 단어만 출력됩니다. 기본값은 2입니다. 최대값은 300입니다.

minWordSize

최소 단어 크기입니다. 이보다 긴 단어만 처리됩니다. 기본값은 5입니다. 최대값은 300입니다.

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

onlyLongestMatch

출력에 가장 긴 일치 하위 단어만 추가할지 여부를 나타내는 값입니다. 기본값은 false입니다.

wordList

일치시킬 단어 목록입니다.

상속된 속성

name

토큰 필터의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

속성 세부 정보

maxSubwordSize

최대 하위 단어 크기입니다. 이보다 짧은 하위 단어만 출력됩니다. 기본값은 15입니다. 최대값은 300입니다.

maxSubwordSize?: number

속성 값

number

minSubwordSize

최소 하위 단어 크기입니다. 이보다 긴 하위 단어만 출력됩니다. 기본값은 2입니다. 최대값은 300입니다.

minSubwordSize?: number

속성 값

number

minWordSize

최소 단어 크기입니다. 이보다 긴 단어만 처리됩니다. 기본값은 5입니다. 최대값은 300입니다.

minWordSize?: number

속성 값

number

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

odatatype: "#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"

속성 값

"#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter"

onlyLongestMatch

출력에 가장 긴 일치 하위 단어만 추가할지 여부를 나타내는 값입니다. 기본값은 false입니다.

onlyLongestMatch?: boolean

속성 값

boolean

wordList

일치시킬 단어 목록입니다.

wordList: string[]

속성 값

string[]

상속된 속성 세부 정보

name

토큰 필터의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

name: string

속성 값

string

BaseTokenFilter.name 상속됨