Formatos de documentos e diretrizes de convenção de nomenclatura
Qualquer arquivo usado para tradução personalizada deve ter pelo menos quatro caracteres de comprimento.
Essa tabela inclui todos os formatos de arquivos com suporte que podem ser utilizados para construir o sistema de tradução:
Formatar | Extensões | Descrição |
---|---|---|
XLIFF |
.XLF , .XLIFF |
Um formato de documento paralelo, exportação de sistemas de Memória de Tradução. Os idiomas utilizados são definidos dentro do arquivo. |
TMX |
.TMX |
Um formato de documento paralelo, exportação de sistemas de Memória de Tradução. Os idiomas utilizados são definidos dentro do arquivo. |
ZIP |
.ZIP |
Um formato de arquivo morto. |
Locstudio |
.LCL |
Um formato da Microsoft para documentos paralelos |
Microsoft Word | .DOCX |
Documento do Microsoft Word |
Adobe Acrobat | .PDF |
Documento portátil do Adobe Acrobat |
HTML |
.HTML , .HTM |
Documento de Linguagem de Marcação do HyperText |
Arquivo de texto | .TXT |
Arquivos de texto codificados em UTF-16 ou UTF-8. O nome do arquivo não deve conter caracteres em japonês. |
Arquivo de texto alinhado | .ALIGN |
A extensão .ALIGN é uma extensão especial que você poderá usar se souber que as sentenças no par de documentos estão perfeitamente alinhadas. Se você fornecer um arquivo .ALIGN , o Tradutor Personalizado não alinhará as frases para você. |
Arquivo do Excel | .XLSX |
Arquivo Excel (2013 ou posterior). A primeira linha/linha da planilha deverá ser o código do idioma. |
Formatos de dicionário
Para dicionários, o Tradutor Personalizado é compatível com todos os formatos de arquivos com suporte para conjunto de treinamento. Se estiver usando o dicionário do Excel, a primeira linha/coluna da planilha deverá ter os códigos de idiomas.
Formatos de arquivo ZIP
Os documentos podem ser agrupados em um único arquivo zip e enviados. O Tradutor Personalizado dá suporte a formatos de arquivo ZIP (ZIP
, GZ
e TGZ
).
Cada documento no arquivo zip com extensão TXT, HTML, HTM, PDF, DOCX, ALIGN deve seguir essa convenção de nomenclatura:
{nome do documento}_{código do idioma} onde {nome do documento} é o nome do documento, {código do idioma} é a ID de idioma ISO (dois caracteres), indicando que o documento contém sentenças nesse idioma. É necessário ter um sublinhado (_) antes do código do idioma.
Por exemplo, para enviar dois documentos paralelos em um zip para um sistema de inglês para espanhol, os arquivos deverão ser nomeados data_en
e data_es
.
Arquivos de memória de tradução (TMX
, XLF
, XLIFF
, LCL
, XLSX
) não são necessários para seguir a convenção de nomenclatura de idioma específica.