Partager via


Qu’est-ce que la traduction de documents ?

La traduction de documentation est une fonctionnalité de traduction automatique cloud du service Azure AI Traducteur. Vous pouvez traduire des documents multiples et complexes dans la totalité des langues et dialectes pris en charge tout en conservant la structure de documents et le format de données d’origine. L’API Traduction de documentation prend en charge deux processus de traduction :

  • La traduction par lots asynchrone prend en charge le traitement de plusieurs documents et fichiers volumineux. Le processus de traduction par lots nécessite un compte Stockage Blob Azure avec des conteneurs de stockage pour vos documents sources et traduits.

  • La traduction de fichier unique synchrone prend en charge le traitement des traductions de fichiers uniques. Le processus de traduction de fichiers ne nécessite pas de compte de stockage Blob Azure. La réponse finale contient le document traduit et est retournée directement au client appelant.

Traduction par lots asynchrone

Utilisez le traitement asynchrone de documents pour traduire plusieurs documents et fichiers volumineux.

Fonctionnalités clés de la traduction par lots

Fonctionnalité Description
Traduire des fichiers volumineux Traduisez des documents entiers de manière asynchrone.
Traduire de nombreux fichiers Traduisez plusieurs fichiers dans la totalité des langues et dialectes pris en charge tout en préservant la structure des documents et le format des données.
Conserver la présentation du fichier source Traduisez les fichiers tout en conservant la disposition et le format d’origine.
Personnaliser la traduction Traduisez des documents à l’aide de modèles de traduction généraux et personnalisés.
Appliquer des glossaires personnalisés Traduisez des documents à l’aide de glossaires personnalisés.
Détecter automatiquement la langue du document Laissez le service de traduction de documentation déterminer la langue du document.
Traduire des documents présentant un contenu multilingue Utilisez la fonctionnalité de détection automatique pour traduire dans votre langue cible des documents présentant un contenu multilingue.

Options de développement de la traduction par lots

Vous pouvez ajouter une traduction de documentation à vos applications à l’aide de l’API REST ou d’un kit de développement logiciel (SDK) de bibliothèque cliente :

  • L’API REST. est une interface indépendante du langage qui vous permet de créer des requêtes HTTP et des en-têtes d’autorisation pour traduire des documents.

  • Les Kits de développement logiciel (SDK) de la bibliothèque cliente sont des classes, des objets, des méthodes et du code spécifiques au langage que vous pouvez utiliser rapidement en ajoutant une référence dans votre projet. Actuellement, la traduction de documentation propose un support du langage de programmation pour C#/.NET et Python.

Formats de document pris en charge de la traduction par lots

La méthode Get supported document formats renvoie la liste des formats de documents pris en charge par le service Traduction de documentation. La liste comprend l’extension de fichier commune et le content-type si vous utilisez l’API de chargement.

Type de fichier Extension de fichier Description
Adobe PDF pdf Format de fichier de document portable. La traduction de documentation utilise la technologie de reconnaissance optique de caractères (OCR) pour extraire et traduire le texte d’un document PDF scanné tout en conservant la disposition d’origine.
Valeurs séparées par des virgules csv Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul.
HTML html, htm Hyper Text Markup Language.
Format du fichier d’échange de localisation xlf Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Langage de balisage léger permettant de créer du texte mis en forme.
M​HTML mthml, mht Format d’archive de page web utilisé pour combiner du code HTML et ses ressources associées.
Microsoft Excel xls, xlsx Fichier de feuille de calcul pour l’analyse et la documentation des données.
Microsoft Outlook msg E-mail créé ou enregistré dans Microsoft Outlook.
Microsoft PowerPoint ppt, pptx Fichier de présentation utilisé pour afficher le contenu dans un format de diaporama.
Microsoft Word doc, docx Fichier de document texte.
Texte OpenDocument odt Fichier de document texte open source.
Présentation OpenDocument odp Fichier de présentation open source.
Feuille de calcul OpenDocument ods Fichier de feuille de calcul open source.
Format de texte enrichi rtf Document texte contenant une mise en forme.
Valeurs séparées par des tabulations/TAB tsv/tab Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul.
Texte txt Document texte non mis en forme.

Types de fichiers hérités de la traduction par lots

Les types de fichiers sources sont conservés lors de la traduction de documentation avec les exceptions suivantes :

Extension des fichiers sources Extension des fichiers traduits
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formats de glossaire pris en charge de la traduction par lots

La traduction de documentation prend en charge les types de fichiers de glossaire suivants :

Type de fichier Extension de fichier Description
Valeurs séparées par des virgules csv Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul.
Format du fichier d’échange de localisation xlf , xliff Un format de document parallèle, exportation des systèmes de mémoire de traduction utilisés par les langages sont définis dans le fichier.
Valeurs séparées par des tabulations/TAB tsv, tab Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul.

Traduction synchrone

Utilisez le traitement de traduction synchrone pour envoyer un document dans le corps de la requête HTTP et recevoir le document traduit dans la réponse HTTP.

Fonctionnalités clés de la traduction synchrone

Fonctionnalité Description
Traduire des fichiers monopages La requête synchrone n’accepte qu’un seul document comme entrée.
Conserver la présentation du fichier source Traduisez les fichiers tout en conservant la disposition et le format d’origine.
Personnaliser la traduction Traduisez des documents à l’aide de modèles de traduction généraux et personnalisés.
Appliquer des glossaires personnalisés Traduisez des documents à l’aide de glossaires personnalisés.
Traduction en une seule langue Traduire vers et depuis une langue prise en charge.
Détecter automatiquement la langue du document Laissez le service de traduction de documentation déterminer la langue du document.
Appliquer des glossaires personnalisés Traduire un document à l’aide d’un glossaire personnalisé.

Formats de document pris en charge de la traduction synchrone

Type de fichier Extension de fichier Type de contenu Description
Texte brut .txt text/plain Document texte non mis en forme.
Valeurs séparées par des tabulations .txv
.tab
text/tab-separated-values Format de fichier texte qui utilise des tabulations pour séparer les valeurs et des sauts de ligne pour séparer les enregistrements.
Valeurs séparées par des virgules .csv text/csv Format de fichier texte qui utilise des virgules comme délimiteur entre les valeurs.
Hypertext Markup Language .html
.htm
text/html HTML est un langage de balisage standard utilisé pour structurer les pages web et le contenu.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Format de fichier d’archive de page web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Format de fichier XML utilisé pour les présentations de diaporama PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Format de fichier XML utilisé pour les feuilles de calcul Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Format de fichier XML utilisé pour les documents Word.
Microsoft Outlook .msg application/vnd.ms-outlook Format de fichier utilisé pour les objets de message Outlook stockés.
Xml Localization Interchange .xlf
.xliff
application/xliff+xml Format de fichier XML standardisé largement utilisé dans le traitement logiciel de traduction et de localisation.

Formats de glossaire pris en charge de la traduction synchrone

La traduction de documentation prend en charge les types de fichiers de glossaire suivants :

Type de fichier Extension de fichier Description
Valeurs séparées par des virgules csv Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul.
XmlLocalizationInterchange xlf , xliff Format XML conçu pour standardiser la façon dont les données sont passées pendant le processus de localisation.
TabSeparatedValues tsv, tab Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul.

Limites des requêtes de Traduction de documentation

Pour plus d’informations sur les limites d’une requête de service Azure AI Traducteur, consultez Limites d’une requête de traduction de documentation.

Résidence des données de traduction de documentation

La résidence des données de traduction de documentation dépend de la région Azure où votre ressource Traducteur a été créée :

✔️ Fonctionnalité : Traduction de documentation
✔️ Point de terminaison de service : Personnaliser : <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Région créée par la ressource Centre de données de traitement des requêtes
Global Centre de données disponible le plus proche.
Amérique USA Est 2 • USA Ouest 2
Asie-Pacifique Japon Est • Asie Sud-Est
Europe (à l’exception de la Suisse) France Centre • Europe Ouest
Suisse Suisse Nord • Suisse Ouest

Étapes suivantes

Dans notre démarrage rapide, vous apprendrez comment commencer à utiliser la traduction de documentation. Pour commencer, vous avez besoin d’un compte Azure actif. Si vous n’en avez pas, vous pouvez créer un compte gratuit.