Partager via


Windows.Data.Text Espace de noms

Prend en charge l’identification des segments de texte et la détermination des propriétés des caractères Unicode.

Classes

AlternateWordForm

Identifie une autre forme du mot représenté par un objet WordSegment . Par exemple, il peut contenir un nombre dans un format normalisé.

SelectableWordSegment

Représente un segment de votre texte fourni qui inclut un mot et tout espace blanc et/ou ponctuation de fin après ce mot.

SelectableWordsSegmenter

Classe segmenteur capable de segmenter le texte fourni en unités appropriées pour sélectionner du texte par mots.

La langue fournie lors de la construction de cet objet est mise en correspondance avec les langues avec des disjoncteurs sur le système, et les meilleures règles de segmentation de mots disponibles sont utilisées. La langue ne doit pas nécessairement être l’une des langues prises en charge par l’application. S’il n’existe aucune règle de langue prise en charge spécifiquement pour cette langue, les règles non linguistiques sont utilisées (une implémentation de l’annexe standard Unicode #29 Segmentation de texte Unicode) et la propriété ResolvedLanguage est définie sur « und » (langue indéterminée).

SemanticTextQuery

Permet aux applications d’effectuer des requêtes de texte à l’aide de chaînes AQS (Advanced Query Syntax), avec la possibilité de fournir une balise de langue à utiliser dans la requête.

TextConversionGenerator

Convertit les caractères phonétiques d’entrée en une collection de caractères idéographiques correspondants (caractères chinois).

L’entrée de pinyin japonais et chinois est prise en charge.

TextPhoneme

Représente le résultat de l’appel de la méthode TextReverseConversionGenerator.GetPhonemesAsync , encapsulant à la fois le texte d’affichage d’origine et les phonèmes qui correspondent au texte d’affichage d’origine.

TextPredictionGenerator

Prédit les mots japonais en fonction d’un préfixe de caractères phonétiques.

TextReverseConversionGenerator

Inverse convertit une chaîne japonaise qui est un mélange de caractères phonétiques et idéographiques, en une chaîne de caractères phonétiques.

UnicodeCharacters

Fournit un moyen pour les applications d’obtenir des informations sur les caractères Unicode, conformément à l’annexe standard Unicode #44.

WordSegment

Représente un mot du texte fourni.

Les mots de cette classe n’incluent pas d’espace blanc ou de ponctuation de fin. Cette classe peut également exposer d’autres formes de mots, ainsi que des nombres normalisés, des devises, des dates et des heures.

WordsSegmenter

Classe segmenteur capable de segmenter le texte fourni en mots ou en tiges de mot (selon la langue).

Structures

TextSegment

Identifie une sous-chaîne d’une chaîne de texte source. Votre application peut utiliser cette structure pour obtenir le segment de votre texte fourni identifié par AlternateWordForm, SelectableWordSegment, WordSegment ou SemanticTextQuery.

Énumérations

AlternateNormalizationFormat

Identifie le format de normalisation d’un objet AlternateWordForm .

TextPredictionOptions

Définit des constantes qui spécifient des options de prédiction de texte.

UnicodeGeneralCategory

Définit la catégorie générale Unicode d’un caractère.

UnicodeNumericType

Définit le type de nombre lorsqu’un caractère Unicode représente un nombre.

Délégués

SelectableWordSegmentsTokenizingHandler

Définit la signature d’une fonction fournie à SelectableWordsSegmenter.Tokenize.

WordSegmentsTokenizingHandler

Définit la signature d’une fonction fournie à WordsSegmenter.Tokenize.

Voir aussi