다음을 통해 공유


WordsSegmenter 클래스

정의

제공된 텍스트를 단어 또는 단어 줄기로 분할할 수 있는 세그먼트 클래스입니다(특정 언어에 따라 다름).

public ref class WordsSegmenter sealed
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, Windows.Foundation.UniversalApiContract)]
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
class WordsSegmenter final
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, "Windows.Foundation.UniversalApiContract")]
class WordsSegmenter final
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, typeof(Windows.Foundation.UniversalApiContract))]
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
public sealed class WordsSegmenter
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, "Windows.Foundation.UniversalApiContract")]
public sealed class WordsSegmenter
function WordsSegmenter(language)
Public NotInheritable Class WordsSegmenter
상속
Object Platform::Object IInspectable WordsSegmenter
특성

Windows 요구 사항

디바이스 패밀리
Windows 10 (10.0.10240.0 - for Xbox, see UWP features that aren't yet supported on Xbox에서 도입되었습니다.)
API contract
Windows.Foundation.UniversalApiContract (v1.0에서 도입되었습니다.)

설명

단어 간 공백(예: 일본어, 중국어, 한국어, 태국어)을 사용하지 않는 언어의 경우 세그먼트를 사용하면 검색과 같은 텍스트 처리 시나리오에서 개별 단어를 가져올 수 키워드(keyword).

이 개체가 생성될 때 제공되는 언어는 시스템에서 단어 분리기가 있는 언어와 일치하며 사용 가능한 최상의 단어 구분 규칙이 사용됩니다. 언어는 앱에서 지원되는 언어 중 하나일 필요가 없습니다. 해당 언어에 대해 특별히 사용할 수 있는 지원되는 언어 규칙이 없는 경우 언어 중립적 규칙( 유니코드 표준 부속서 #29 유니코드 텍스트 구분 구현)이 사용되고 ResolvedLanguage 속성이 "und"(결정되지 않은 언어)로 설정됩니다.

키워드(keyword) 검색 시나리오의 경우 항상 텍스트 콘텐츠의 언어로 세그먼트를 요청하는 것이 좋습니다.

맞춤법 검사 시나리오의 경우 일부 언어 세그먼트(예: 독일어)는 단일 복합 단어에 대해 여러 단어 줄기 세그먼트를 반환할 수 있습니다. 반면 맞춤법 검사 API는 단어가 한 단어로 함께 유지될 것으로 예상할 수 있습니다. 이러한 언어의 경우 "und"(결정되지 않은 언어) 세그먼트를 명시적으로 요청하여 언어 중립 분할 규칙을 강제 적용하도록 선택할 수 있습니다. 그러나 이렇게 하면 간격이 없는 언어의 품질이 크게 저하됩니다. 따라서 Language.Script API를 사용하여 콘텐츠 언어가 다음 공백이 아닌 스크립트 중 하나를 사용하는지 확인하는 것이 좋습니다.

스크립트 언어
보포 () Bopomofo
Brah 브라미 ()
Egyp 이집트 상형 문자
고트 고딕
걸림 새 한글
걸림 새 히라가나
걸림 새 옛 한글
하니어 Han
Ital 이전 기울임꼴
Java 자바어
Kana 가타카나
하르 주 Kharoshthi
Khmr 크메르어
Laoo 라오어
Lisu Lisu
Mymr 미얀마
Talu New Tai Lue
태국어 태국어
Tibt 티베트어
Xsux Cuneiform
Yiii 이 문자

이러한 스크립트를 찾을 수 없는 경우 맞춤법 검사 시나리오 구분에 "und"를 사용하는 것이 안전해야 합니다.

생성자

WordsSegmenter(String)

WordsSegmenter 개체를 만듭니다. 이 생성자에 제공된 언어가 사용되는 방법에 대한 설명은 WordsSegmenter 의 소개를 참조하세요.

속성

ResolvedLanguage

WordsSegmenter 개체에서 사용하는 규칙의 언어를 가져옵니다.

언어 중립적 규칙을 사용하는 경우 "und"(결정되지 않음)가 반환됩니다.

메서드

GetTokenAt(String, UInt32)

지정된 인덱스를 포함하거나 따라 제공된 텍스트로 단어 또는 단어 스템을 결정하고 반환합니다.

GetTokens(String)

제공된 텍스트에서 모든 단어 또는 단어 줄기를 결정하고 반환합니다.

Tokenize(String, UInt32, WordSegmentsTokenizingHandler)

제공된 처리기를 호출하여 지정된 인덱스 이전과 다음의 단어를 반복하는 두 개의 반복기를 제공된 텍스트로 호출합니다.

적용 대상