WordDelimiterTokenFilter interface
단어를 부분 단어로 분할하고 부분 단어 그룹에 대해 선택적 변환을 수행합니다. 이 토큰 필터는 Apache Lucene을 사용하여 구현됩니다.
- Extends
속성
catenate |
모든 하위 단어 부분을 범주화할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "Azure-Search-1"은 "AzureSearch1"이 됩니다. 기본값은 false입니다. |
catenate |
숫자 부분의 최대 실행을 범주화할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "1-2"는 "12"가 됩니다. 기본값은 false입니다. |
catenate |
단어 부분의 최대 실행을 범주화할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "Azure-Search"는 "AzureSearch"가 됩니다. 기본값은 false입니다. |
generate |
숫자 하위 단어를 생성할지 여부를 나타내는 값입니다. 기본값은 true입니다. |
generate |
파트 단어를 생성할지 여부를 나타내는 값입니다. 를 설정하면 단어의 일부가 생성됩니다. 예를 들어 "AzureSearch"는 "Azure" "Search"가 됩니다. 기본값은 true입니다. |
odatatype | 이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자 |
preserve |
원래 단어를 보존하고 하위 단어 목록에 추가할지 여부를 나타내는 값입니다. 기본값은 false입니다. |
protected |
구분되지 않도록 보호할 토큰 목록입니다. |
split |
caseChange에서 단어를 분할할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "AzureSearch"는 "Azure" "Search"가 됩니다. 기본값은 true입니다. |
split |
숫자로 분할할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "Azure1Search"는 "Azure" "1" "Search"가 됩니다. 기본값은 true입니다. |
stem |
각 하위 단어에 대해 후행 "'s"를 제거할지 여부를 나타내는 값입니다. 기본값은 true입니다. |
상속된 속성
name | 토큰 필터의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다. |
속성 세부 정보
catenateAll
모든 하위 단어 부분을 범주화할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "Azure-Search-1"은 "AzureSearch1"이 됩니다. 기본값은 false입니다.
catenateAll?: boolean
속성 값
boolean
catenateNumbers
숫자 부분의 최대 실행을 범주화할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "1-2"는 "12"가 됩니다. 기본값은 false입니다.
catenateNumbers?: boolean
속성 값
boolean
catenateWords
단어 부분의 최대 실행을 범주화할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "Azure-Search"는 "AzureSearch"가 됩니다. 기본값은 false입니다.
catenateWords?: boolean
속성 값
boolean
generateNumberParts
숫자 하위 단어를 생성할지 여부를 나타내는 값입니다. 기본값은 true입니다.
generateNumberParts?: boolean
속성 값
boolean
generateWordParts
파트 단어를 생성할지 여부를 나타내는 값입니다. 를 설정하면 단어의 일부가 생성됩니다. 예를 들어 "AzureSearch"는 "Azure" "Search"가 됩니다. 기본값은 true입니다.
generateWordParts?: boolean
속성 값
boolean
odatatype
이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자
odatatype: "#Microsoft.Azure.Search.WordDelimiterTokenFilter"
속성 값
"#Microsoft.Azure.Search.WordDelimiterTokenFilter"
preserveOriginal
원래 단어를 보존하고 하위 단어 목록에 추가할지 여부를 나타내는 값입니다. 기본값은 false입니다.
preserveOriginal?: boolean
속성 값
boolean
protectedWords
구분되지 않도록 보호할 토큰 목록입니다.
protectedWords?: string[]
속성 값
string[]
splitOnCaseChange
caseChange에서 단어를 분할할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "AzureSearch"는 "Azure" "Search"가 됩니다. 기본값은 true입니다.
splitOnCaseChange?: boolean
속성 값
boolean
splitOnNumerics
숫자로 분할할지 여부를 나타내는 값입니다. 예를 들어 이 값이 true로 설정된 경우 "Azure1Search"는 "Azure" "1" "Search"가 됩니다. 기본값은 true입니다.
splitOnNumerics?: boolean
속성 값
boolean
stemEnglishPossessive
각 하위 단어에 대해 후행 "'s"를 제거할지 여부를 나타내는 값입니다. 기본값은 true입니다.
stemEnglishPossessive?: boolean
속성 값
boolean