Qu’est-ce que la traduction de documents ?
La traduction de documentation est une fonctionnalité de traduction automatique cloud du service Azure AI Traducteur. Vous pouvez traduire des documents multiples et complexes dans la totalité des langues et dialectes pris en charge tout en conservant la structure de documents et le format de données d’origine. L’API Traduction de documentation prend en charge deux processus de traduction :
La traduction par lots asynchrone prend en charge le traitement de plusieurs documents et fichiers volumineux. Le processus de traduction par lots nécessite un compte Stockage Blob Azure avec des conteneurs de stockage pour vos documents sources et traduits.
La traduction de fichier unique synchrone prend en charge le traitement des traductions de fichiers uniques. Le processus de traduction de fichiers ne nécessite pas de compte de stockage Blob Azure. La réponse finale contient le document traduit et est retournée directement au client appelant.
Traduction par lots asynchrone
Utilisez le traitement asynchrone de documents pour traduire plusieurs documents et fichiers volumineux.
Fonctionnalités clés de la traduction par lots
Fonctionnalité | Description |
---|---|
Traduire des fichiers volumineux | Traduisez des documents entiers de manière asynchrone. |
Traduire de nombreux fichiers | Traduisez plusieurs fichiers dans la totalité des langues et dialectes pris en charge tout en préservant la structure des documents et le format des données. |
Conserver la présentation du fichier source | Traduisez les fichiers tout en conservant la disposition et le format d’origine. |
Personnaliser la traduction | Traduisez des documents à l’aide de modèles de traduction généraux et personnalisés. |
Appliquer des glossaires personnalisés | Traduisez des documents à l’aide de glossaires personnalisés. |
Détecter automatiquement la langue du document | Laissez le service de traduction de documentation déterminer la langue du document. |
Traduire des documents présentant un contenu multilingue | Utilisez la fonctionnalité de détection automatique pour traduire dans votre langue cible des documents présentant un contenu multilingue. |
Options de développement de la traduction par lots
Vous pouvez ajouter une traduction de documentation à vos applications à l’aide de l’API REST ou d’un kit de développement logiciel (SDK) de bibliothèque cliente :
L’API REST. est une interface indépendante du langage qui vous permet de créer des requêtes HTTP et des en-têtes d’autorisation pour traduire des documents.
Les Kits de développement logiciel (SDK) de la bibliothèque cliente sont des classes, des objets, des méthodes et du code spécifiques au langage que vous pouvez utiliser rapidement en ajoutant une référence dans votre projet. Actuellement, la traduction de documentation propose un support du langage de programmation pour C#/.NET et Python.
Formats de document pris en charge de la traduction par lots
La méthode Get supported document formats renvoie la liste des formats de documents pris en charge par le service Traduction de documentation. La liste comprend l’extension de fichier commune et le content-type si vous utilisez l’API de chargement.
Type de fichier | Extension de fichier | Description |
---|---|---|
Adobe PDF | pdf |
Format de fichier de document portable. La traduction de documentation utilise la technologie de reconnaissance optique de caractères (OCR) pour extraire et traduire le texte d’un document PDF scanné tout en conservant la disposition d’origine. |
Valeurs séparées par des virgules | csv |
Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul. |
HTML | html , htm |
Hyper Text Markup Language. |
Format du fichier d’échange de localisation | xlf | Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier. |
Markdown | markdown , mdown , mkdn , md , mkd , mdwn , mdtxt , mdtext , rmd |
Langage de balisage léger permettant de créer du texte mis en forme. |
MHTML | mthml , mht |
Format d’archive de page web utilisé pour combiner du code HTML et ses ressources associées. |
Microsoft Excel | xls , xlsx |
Fichier de feuille de calcul pour l’analyse et la documentation des données. |
Microsoft Outlook | msg |
E-mail créé ou enregistré dans Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
Fichier de présentation utilisé pour afficher le contenu dans un format de diaporama. |
Microsoft Word | doc , docx |
Fichier de document texte. |
Texte OpenDocument | odt |
Fichier de document texte open source. |
Présentation OpenDocument | odp |
Fichier de présentation open source. |
Feuille de calcul OpenDocument | ods |
Fichier de feuille de calcul open source. |
Format de texte enrichi | rtf |
Document texte contenant une mise en forme. |
Valeurs séparées par des tabulations/TAB | tsv /tab |
Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul. |
Texte | txt |
Document texte non mis en forme. |
Types de fichiers hérités de la traduction par lots
Les types de fichiers sources sont conservés lors de la traduction de documentation avec les exceptions suivantes :
Extension des fichiers sources | Extension des fichiers traduits |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Formats de glossaire pris en charge de la traduction par lots
La traduction de documentation prend en charge les types de fichiers de glossaire suivants :
Type de fichier | Extension de fichier | Description |
---|---|---|
Valeurs séparées par des virgules | csv |
Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul. |
Format du fichier d’échange de localisation | xlf , xliff |
Un format de document parallèle, exportation des systèmes de mémoire de traduction utilisés par les langages sont définis dans le fichier. |
Valeurs séparées par des tabulations/TAB | tsv , tab |
Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul. |
Traduction synchrone
Utilisez le traitement de traduction synchrone pour envoyer un document dans le corps de la requête HTTP et recevoir le document traduit dans la réponse HTTP.
Fonctionnalités clés de la traduction synchrone
Fonctionnalité | Description |
---|---|
Traduire des fichiers monopages | La requête synchrone n’accepte qu’un seul document comme entrée. |
Conserver la présentation du fichier source | Traduisez les fichiers tout en conservant la disposition et le format d’origine. |
Personnaliser la traduction | Traduisez des documents à l’aide de modèles de traduction généraux et personnalisés. |
Appliquer des glossaires personnalisés | Traduisez des documents à l’aide de glossaires personnalisés. |
Traduction en une seule langue | Traduire vers et depuis une langue prise en charge. |
Détecter automatiquement la langue du document | Laissez le service de traduction de documentation déterminer la langue du document. |
Appliquer des glossaires personnalisés | Traduire un document à l’aide d’un glossaire personnalisé. |
Formats de document pris en charge de la traduction synchrone
Type de fichier | Extension de fichier | Type de contenu | Description |
---|---|---|---|
Texte brut | .txt |
text/plain |
Document texte non mis en forme. |
Valeurs séparées par des tabulations | .txv .tab |
text/tab-separated-values |
Format de fichier texte qui utilise des tabulations pour séparer les valeurs et des sauts de ligne pour séparer les enregistrements. |
Valeurs séparées par des virgules | .csv |
text/csv |
Format de fichier texte qui utilise des virgules comme délimiteur entre les valeurs. |
Hypertext Markup Language | .html .htm |
text/html |
HTML est un langage de balisage standard utilisé pour structurer les pages web et le contenu. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Format de fichier d’archive de page web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Format de fichier XML utilisé pour les présentations de diaporama PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Format de fichier XML utilisé pour les feuilles de calcul Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Format de fichier XML utilisé pour les documents Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Format de fichier utilisé pour les objets de message Outlook stockés. |
Xml Localization Interchange | .xlf .xliff |
application/xliff+xml |
Format de fichier XML standardisé largement utilisé dans le traitement logiciel de traduction et de localisation. |
Formats de glossaire pris en charge de la traduction synchrone
La traduction de documentation prend en charge les types de fichiers de glossaire suivants :
Type de fichier | Extension de fichier | Description |
---|---|---|
Valeurs séparées par des virgules | csv |
Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul. |
XmlLocalizationInterchange | xlf , xliff |
Format XML conçu pour standardiser la façon dont les données sont passées pendant le processus de localisation. |
TabSeparatedValues | tsv , tab |
Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul. |
Limites des requêtes de Traduction de documentation
Pour plus d’informations sur les limites d’une requête de service Azure AI Traducteur, consultez Limites d’une requête de traduction de documentation.
Résidence des données de traduction de documentation
La résidence des données de traduction de documentation dépend de la région Azure où votre ressource Traducteur a été créée :
✔️ Fonctionnalité : Traduction de documentation
✔️ Point de terminaison de service : Personnaliser : <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Région créée par la ressource | Centre de données de traitement des requêtes |
---|---|
Global | Centre de données disponible le plus proche. |
Amérique | USA Est 2 • USA Ouest 2 |
Asie-Pacifique | Japon Est • Asie Sud-Est |
Europe (à l’exception de la Suisse) | France Centre • Europe Ouest |
Suisse | Suisse Nord • Suisse Ouest |
Étapes suivantes
Dans notre démarrage rapide, vous apprendrez comment commencer à utiliser la traduction de documentation. Pour commencer, vous avez besoin d’un compte Azure actif. Si vous n’en avez pas, vous pouvez créer un compte gratuit.