MicrosoftLanguageTokenizer interface

언어별 규칙을 사용하여 텍스트를 구분합니다.

속성

isSearchTokenizer	토큰라이저를 사용하는 방법을 나타내는 값입니다. 검색 토큰라이저로 사용되는 경우 true로 설정하고 인덱싱 토큰라이저로 사용하는 경우 false로 설정합니다. 기본값은 false입니다.
language	사용할 언어입니다. 기본값은 영어입니다.
maxTokenLength	최대 토큰 길이입니다. 최대 길이보다 긴 토큰은 분할됩니다. 사용할 수 있는 최대 토큰 길이는 300자입니다. 300자보다 긴 토큰은 먼저 길이가 300인 토큰으로 분할된 다음, 각 토큰은 최대 토큰 길이 집합에 따라 분할됩니다. 기본값은 255입니다.
odatatype	이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

name	토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

토큰라이저를 사용하는 방법을 나타내는 값입니다. 검색 토큰라이저로 사용되는 경우 true로 설정하고 인덱싱 토큰라이저로 사용하는 경우 false로 설정합니다. 기본값은 false입니다.

isSearchTokenizer?: boolean

boolean

사용할 언어입니다. 기본값은 영어입니다.

language?: MicrosoftTokenizerLanguage

최대 토큰 길이입니다. 최대 길이보다 긴 토큰은 분할됩니다. 사용할 수 있는 최대 토큰 길이는 300자입니다. 300자보다 긴 토큰은 먼저 길이가 300인 토큰으로 분할된 다음, 각 토큰은 최대 토큰 길이 집합에 따라 분할됩니다. 기본값은 255입니다.

maxTokenLength?: number

number

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

name: string

string

BaseLexicalTokenizer.name 상속됨