WordsSegmenter 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
제공된 텍스트를 단어 또는 단어 줄기로 분할할 수 있는 세그먼트 클래스입니다(특정 언어에 따라 다름).
public ref class WordsSegmenter sealed
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, Windows.Foundation.UniversalApiContract)]
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
class WordsSegmenter final
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, "Windows.Foundation.UniversalApiContract")]
class WordsSegmenter final
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, typeof(Windows.Foundation.UniversalApiContract))]
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
public sealed class WordsSegmenter
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, "Windows.Foundation.UniversalApiContract")]
public sealed class WordsSegmenter
function WordsSegmenter(language)
Public NotInheritable Class WordsSegmenter
- 상속
- 특성
Windows 요구 사항
디바이스 패밀리 |
Windows 10 (10.0.10240.0 - for Xbox, see UWP features that aren't yet supported on Xbox에서 도입되었습니다.)
|
API contract |
Windows.Foundation.UniversalApiContract (v1.0에서 도입되었습니다.)
|
설명
단어 간 공백(예: 일본어, 중국어, 한국어, 태국어)을 사용하지 않는 언어의 경우 세그먼트를 사용하면 검색과 같은 텍스트 처리 시나리오에서 개별 단어를 가져올 수 키워드(keyword).
이 개체가 생성될 때 제공되는 언어는 시스템에서 단어 분리기가 있는 언어와 일치하며 사용 가능한 최상의 단어 구분 규칙이 사용됩니다. 언어는 앱에서 지원되는 언어 중 하나일 필요가 없습니다. 해당 언어에 대해 특별히 사용할 수 있는 지원되는 언어 규칙이 없는 경우 언어 중립적 규칙( 유니코드 표준 부속서 #29 유니코드 텍스트 구분 구현)이 사용되고 ResolvedLanguage 속성이 "und"(결정되지 않은 언어)로 설정됩니다.
키워드(keyword) 검색 시나리오의 경우 항상 텍스트 콘텐츠의 언어로 세그먼트를 요청하는 것이 좋습니다.
맞춤법 검사 시나리오의 경우 일부 언어 세그먼트(예: 독일어)는 단일 복합 단어에 대해 여러 단어 줄기 세그먼트를 반환할 수 있습니다. 반면 맞춤법 검사 API는 단어가 한 단어로 함께 유지될 것으로 예상할 수 있습니다. 이러한 언어의 경우 "und"(결정되지 않은 언어) 세그먼트를 명시적으로 요청하여 언어 중립 분할 규칙을 강제 적용하도록 선택할 수 있습니다. 그러나 이렇게 하면 간격이 없는 언어의 품질이 크게 저하됩니다. 따라서 Language.Script API를 사용하여 콘텐츠 언어가 다음 공백이 아닌 스크립트 중 하나를 사용하는지 확인하는 것이 좋습니다.
스크립트 | 언어 |
---|---|
보포 () | Bopomofo |
Brah | 브라미 () |
Egyp | 이집트 상형 문자 |
고트 | 고딕 |
걸림 새 | 한글 |
걸림 새 | 히라가나 |
걸림 새 | 옛 한글 |
하니어 | Han |
Ital | 이전 기울임꼴 |
Java | 자바어 |
Kana | 가타카나 |
하르 주 | Kharoshthi |
Khmr | 크메르어 |
Laoo | 라오어 |
Lisu | Lisu |
Mymr | 미얀마 |
Talu | New Tai Lue |
태국어 | 태국어 |
Tibt | 티베트어 |
Xsux | Cuneiform |
Yiii | 이 문자 |
이러한 스크립트를 찾을 수 없는 경우 맞춤법 검사 시나리오 구분에 "und"를 사용하는 것이 안전해야 합니다.
생성자
WordsSegmenter(String) |
WordsSegmenter 개체를 만듭니다. 이 생성자에 제공된 언어가 사용되는 방법에 대한 설명은 WordsSegmenter 의 소개를 참조하세요. |
속성
ResolvedLanguage |
이 WordsSegmenter 개체에서 사용하는 규칙의 언어를 가져옵니다. 언어 중립적 규칙을 사용하는 경우 "und"(결정되지 않음)가 반환됩니다. |
메서드
GetTokenAt(String, UInt32) |
지정된 인덱스를 포함하거나 따라 제공된 텍스트로 단어 또는 단어 스템을 결정하고 반환합니다. |
GetTokens(String) |
제공된 텍스트에서 모든 단어 또는 단어 줄기를 결정하고 반환합니다. |
Tokenize(String, UInt32, WordSegmentsTokenizingHandler) |
제공된 처리기를 호출하여 지정된 인덱스 이전과 다음의 단어를 반복하는 두 개의 반복기를 제공된 텍스트로 호출합니다. |