MicrosoftLanguageTokenizer interface
언어별 규칙을 사용하여 텍스트를 구분합니다.
- Extends
속성
is |
토큰라이저를 사용하는 방법을 나타내는 값입니다. 검색 토큰라이저로 사용되는 경우 true로 설정하고 인덱싱 토큰라이저로 사용하는 경우 false로 설정합니다. 기본값은 false입니다. |
language | 사용할 언어입니다. 기본값은 영어입니다. |
max |
최대 토큰 길이입니다. 최대 길이보다 긴 토큰은 분할됩니다. 사용할 수 있는 최대 토큰 길이는 300자입니다. 300자보다 긴 토큰은 먼저 길이가 300인 토큰으로 분할된 다음, 각 토큰은 최대 토큰 길이 집합에 따라 분할됩니다. 기본값은 255입니다. |
odatatype | 이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자 |
상속된 속성
name | 토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다. |
속성 세부 정보
isSearchTokenizer
토큰라이저를 사용하는 방법을 나타내는 값입니다. 검색 토큰라이저로 사용되는 경우 true로 설정하고 인덱싱 토큰라이저로 사용하는 경우 false로 설정합니다. 기본값은 false입니다.
isSearchTokenizer?: boolean
속성 값
boolean
language
maxTokenLength
최대 토큰 길이입니다. 최대 길이보다 긴 토큰은 분할됩니다. 사용할 수 있는 최대 토큰 길이는 300자입니다. 300자보다 긴 토큰은 먼저 길이가 300인 토큰으로 분할된 다음, 각 토큰은 최대 토큰 길이 집합에 따라 분할됩니다. 기본값은 255입니다.
maxTokenLength?: number
속성 값
number
odatatype
이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
속성 값
"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"