Compartilhar via


Windows.Data.Text Namespace

Fornece suporte para identificar segmentos de texto e para determinar as propriedades de caracteres Unicode.

Classes

AlternateWordForm

Identifica uma forma alternativa da palavra representada por um objeto WordSegment . Por exemplo, isso pode conter um número em um formato normalizado.

SelectableWordSegment

Representa um segmento do texto fornecido que inclui uma palavra e qualquer espaço em branco à direita e/ou pontuação após essa palavra.

SelectableWordsSegmenter

Uma classe segmentador que é capaz de segmentar o texto fornecido em unidades apropriadas para selecionar texto por palavras.

O idioma fornecido quando esse objeto é construído corresponde aos idiomas com separadores de palavras no sistema e as melhores regras de segmentação de palavras disponíveis são usadas. O idioma não precisa ser um dos idiomas com suporte do aplicativo. Se não houver regras de idioma com suporte disponíveis especificamente para esse idioma, as regras neutras de idioma serão usadas (uma implementação da Segmentação de Texto Unicode nº 29 do Anexo Padrão Unicode) e a propriedade ResolvedLanguage será definida como "und" (idioma indeterminado).

SemanticTextQuery

Permite que os aplicativos executem consultas de texto usando cadeias de caracteres de sintaxe de consulta avançada (AQS), com a opção de fornecer uma marca de idioma a ser empregada na consulta.

TextConversionGenerator

Converte caracteres fonéticos de entrada em uma coleção de caracteres ideográficos correspondentes (caracteres chineses).

Há suporte para a entrada de Pinyin japonês e chinês.

TextPhoneme

Representa o resultado da chamada do método TextReverseConversionGenerator.GetPhonemesAsync , encapsulando o texto de exibição original e os fonemas que correspondem ao texto de exibição original.

TextPredictionGenerator

Prevê palavras japonesas com base em um prefixo de caracteres fonéticos.

TextReverseConversionGenerator

Converte inversa uma cadeia de caracteres japonesa que é uma combinação de caracteres fonéticos e ideográficos, em uma cadeia de caracteres fonéticos.

UnicodeCharacters

Fornece uma maneira de os aplicativos obterem informações sobre caracteres Unicode, de acordo com o Anexo Padrão Unicode nº 44.

WordSegment

Representa uma palavra do texto fornecido.

As palavras nesta classe não incluem espaço em branco à direita ou pontuação. Essa classe também pode expor formas alternativas de palavras e números normalizados, moedas, datas e horas.

WordsSegmenter

Uma classe segmentador que é capaz de segmentar o texto fornecido em palavras ou hastes de palavra (dependendo do idioma específico).

Estruturas

TextSegment

Identifica uma subcadeia de caracteres de uma cadeia de caracteres de texto de origem. Seu aplicativo pode usar essa estrutura para obter o segmento do texto fornecido que é identificado por AlternateWordForm, SelectableWordSegment, WordSegment ou SemanticTextQuery.

Enumerações

AlternateNormalizationFormat

Identifica o formato de normalização de um objeto AlternateWordForm .

TextPredictionOptions

Define constantes que especificam opções de previsão de texto.

UnicodeGeneralCategory

Define a categoria geral Unicode de um caractere.

UnicodeNumericType

Define o tipo de numeral quando um caractere Unicode representa um número.

Delegados

SelectableWordSegmentsTokenizingHandler

Define a assinatura de uma função fornecida para SelectableWordsSegmenter.Tokenize.

WordSegmentsTokenizingHandler

Define a assinatura de uma função que é fornecida a WordsSegmenter.Tokenize.

Confira também