Compartilhar via


O que é a Tradução de Documento?

A Tradução de documentos é um recurso de tradução automática baseado em nuvem do serviço Tradutor de IA do Azure. Você pode traduzir vários e complexos documentos em todos os idiomas e dialetos compatíveis, preservando a estrutura original do documento e o formato de dados. A API da tradução de documento aceita dois processos de tradução:

  • A tradução assíncrona em lote aceita o processamento de vários documentos e arquivos grandes. O processo de tradução em lote exige uma conta de armazenamento de Blobs do Azure com contêineres de armazenamento para seus documentos originais e traduzidos.

  • O arquivo único síncrono aceita o processamento de traduções de arquivo único. O processo de tradução de arquivo não requer uma conta de armazenamento de Blobs do Azure. A resposta final contém o documento traduzido e é retornada diretamente ao cliente que está fazendo a chamada.

Tradução em lote assíncrona

Use o processamento assíncrono de documentos para traduzir vários documentos e arquivos grandes.

Principais funcionalidades do lote

Recurso Descrição
Traduzir grandes arquivos Traduza documentos inteiros de forma assíncrona.
Traduzir vários arquivos Traduza vários arquivos em todos os idiomas e dialetos compatíveis e, ao mesmo tempo, preserve a estrutura do documento e o formato dos dados.
Preservar a apresentação do arquivo de origem Traduza os arquivos, mas preservando o layout e o formato originais.
Aplicar tradução personalizada Traduza documentos com modelos de tradução personalizada e geral.
Aplicar glossários personalizados Traduza documentos usando glossários personalizados.
Detectar o idioma do documento automaticamente Deixe o serviço de Tradução de Documentos determinar o idioma do documento.
Traduza documentos com conteúdo em vários idiomas Use o recurso de detecção automática para traduzir documentos com o conteúdo em vários idiomas para o idioma de destino.

Opções de desenvolvimento do lote

Você pode adicionar a tradução de documento aos seus aplicativos usando a API REST ou um SDK da biblioteca de clientes:

  • A API REST. é uma interface independente de linguagem que permite que você crie solicitações HTTP e cabeçalhos de autorização para traduzir documentos.

  • Os SDKs da biblioteca de clientes são classes, objetos, métodos e códigos específicos da linguagem que você pode usar rapidamente adicionando uma referência ao seu projeto. Atualmente, a tradução de documento tem suporte de linguagem de programação para C#/.NET e Python.

Formatos de documento compatíveis com o lote

O método Obter formatos de documento com suporte retorna uma lista de formatos de documento compatíveis com o serviço Tradução de Documento. A lista inclui a extensão de arquivo comum e o tipo de conteúdo se estiver usando a API de upload.

Tipo de arquivo Extensão de arquivo Descrição
Adobe PDF pdf Formato de arquivo de documento portátil. A Tradução de Documento usa a tecnologia de OCR (reconhecimento óptico de caracteres) para extrair e traduzir texto em documentos PDF digitalizados, mantendo o layout original.
Valores separados por vírgula csv Um arquivo de dados brutos delimitado por vírgula usado por programas de planilha.
HTML html, htm Linguagem HTML.
Formato de arquivo de intercâmbio de localização xlf Um formato de documento paralelo, exportação de sistemas de Memória de Tradução. Os idiomas utilizados são definidos dentro do arquivo.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Um idioma de marcação leve para criar texto formatado.
M​HTML mthml, mht Um formato de camada de arquivos da página da Web usado para combinar o código HTML e seus recursos complementares.
Microsoft Excel xls, xlsx Um arquivo de planilha para análise de dados e documentação.
Microsoft Outlook msg Uma mensagem de email criada ou salva no Microsoft Outlook.
Microsoft PowerPoint ppt, pptx Um arquivo de apresentação usado para exibir conteúdo em um formato de apresentação de slides.
Microsoft Word doc, docx Um arquivo de documento de texto.
Texto OpenDocument odt Um arquivo de documento de texto de software livre.
Apresentação OpenDocument odp Um arquivo de apresentação de software livre.
Planilha OpenDocument ods Um arquivo de planilha de software livre.
Formato Rich Text rtf Um documento de texto que contém formatação.
Valores separados por tabulação/TAB tsv/tab Um arquivo de dados brutos delimitado por tabulação usado por programas de planilha.
Texto txt Um documento de texto não formatado.

Tipos de arquivo herdados do lote

Os tipos de arquivo de origem são preservados durante a tradução de documento com as seguintes exceções:

Extensão do arquivo de origem Extensão do arquivo convertida
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formatos de glossário compatíveis com o lote

A Tradução de Documento dá suporte aos seguintes tipos de arquivo de glossário:

Tipo de arquivo Extensão de arquivo Descrição
Valores Separados por Vírgula csv Um arquivo de dados brutos delimitado por vírgula usado por programas de planilha.
Formato de arquivo de intercâmbio de localização xlf , xliff Um formato de documento paralelo, exportação de sistemas de memória de tradução. Os idiomas usados são definidos dentro do arquivo.
Valores separados por tabulação/TAB tsv, tab Um arquivo de dados brutos delimitado por tabulação usado por programas de planilha.

Tradução síncrona

Use o processamento de tradução síncrona para enviar um documento como parte do corpo da solicitação HTTP e receber o documento traduzido na resposta HTTP.

Principais funcionalidades da tradução síncrona

Recurso Descrição
Traduzir arquivos de página única A solicitação síncrona aceita apenas um único documento como entrada.
Preservar a apresentação do arquivo de origem Traduza os arquivos, mas preservando o layout e o formato originais.
Aplicar tradução personalizada Traduza documentos com modelos de tradução personalizada e geral.
Aplicar glossários personalizados Traduza documentos usando glossários personalizados.
Tradução para um único idioma Traduzir de e para um idioma com suporte.
Detectar o idioma do documento automaticamente Deixe o serviço de Tradução de Documentos determinar o idioma do documento.
Aplicar glossários personalizados Traduzir um documento usando um glossário personalizado.

Formatos de documentos compatíveis para sincronização

Tipo de arquivo Extensão de arquivo Tipo de conteúdo Descrição
Texto sem Formatação .txt text/plain Um documento de texto não formatado.
Valores Separados por Tabulações .txv
.tab
text/tab-separated-values Um formato de arquivo de texto que usa tabulações para separar valores e novas linhas para separar registros.
Valores Separados por Vírgulas .csv text/csv Um formato de arquivo de texto que usa vírgulas como um delimitador entre valores.
Linguagem de Marcação de Hipertexto .html
.htm
text/html HTML é uma linguagem de marcação padrão usada para estruturar páginas e conteúdo da Web.
M​HTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Um formato de arquivo de página da Web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Um formato de arquivo baseado em XML usado para apresentações de slides do PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Um formato de arquivo baseado em XML usado para planilhas do Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Um formato de arquivo baseado em XML usado para documentos do Word.
Microsoft Outlook .msg application/vnd.ms-outlook Um formato de arquivo usado para armazenar objetos de mensagem de email do Outlook.
Intercâmbio de Localização Xml .xlf
.xliff
application/xliff+xml Um formato de arquivo padronizado baseado em XML amplamente usado no processamento de software de tradução e localização.

Formatos de glossário com suporte síncrono

A Tradução de Documento dá suporte aos seguintes tipos de arquivo de glossário:

Tipo de arquivo Extensão de arquivo Descrição
Valores Separados por Vírgula csv Um arquivo de dados brutos delimitado por vírgula usado por programas de planilha.
XmlLocalizationInterchange xlf , xliff Um formato baseado em XML projetado para padronizar a forma como os dados são transmitidos durante o processo de localização.
TabSeparatedValues tsv, tab Um arquivo de dados brutos delimitado por tabulação usado por programas de planilha.

Limites de Solicitação de Tradução de Documentos

Para obter informações detalhadas sobre os limites da solicitação do Serviço Tradutor de IA do Azure, confira Limites de solicitação de tradução de documentos.

Residência de dados de Tradução de Documento

A residência de dados de Tradução de Documento depende da região do Azure em que o recurso de Tradução foi criado:

✔️ Recurso: Tradução de documento
✔️ Ponto de extremidade de serviço: Personalizado: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Região criada pelo recurso Data center de processamento de solicitações
Global Data center disponível mais próximo.
Américas Leste dos EUA 2 • Oeste dos EUA 2
Pacífico Asiático Leste do Japão • Sudeste da Ásia
Europa (exceto Suíça) França Central • Oeste da Europa
Suíça Norte da Suíça • Oeste da Suíça

Próximas etapas

Em nosso início rápido, você começará a usar a Tradução de Documento rapidamente. Para começar, você precisará de uma conta do Azure ativa. Se você não tiver uma, poderá criar uma conta gratuita.