문서 형식 및 명명 규칙 가이드
사용자 지정 번역에 사용하는 파일은 길이가 최소 4자 이상이어야 합니다.
이 표에는 번역 시스템을 빌드할 때 사용할 수 있는 지원되는 파일 형식이 모두 나열되어 있습니다.
형식 | 확장 | 설명 |
---|---|---|
XLIFF |
.XLF : .XLIFF |
번역 메모리 시스템에서 내보낸 병렬 문서 형식입니다. 사용되는 언어는 파일 안에 정의되어 있습니다. |
TMX |
.TMX |
번역 메모리 시스템에서 내보낸 병렬 문서 형식입니다. 사용되는 언어는 파일 안에 정의되어 있습니다. |
ZIP |
.ZIP |
보관 파일 형식입니다. |
Locstudio |
.LCL |
병렬 문서용 Microsoft 형식입니다. |
Microsoft Word | .DOCX |
Microsoft Word 문서 |
Adobe Acrobat | .PDF |
Adobe Acrobat Portable 문서 |
HTML |
.HTML : .HTM |
HTML(Hypertext Markup Language) 문서 |
텍스트 파일 | .TXT |
UTF-16 또는 UTF-8 인코딩된 텍스트 파일. 파일 이름에 일본어 문자를 포함하면 안 됩니다. |
정렬된 텍스트 파일 | .ALIGN |
확장자 .ALIGN 은 문서 쌍의 문장들이 완벽히 정렬된 경우 사용할 수 있는 특수 확장자입니다. Custom Translator에 .ALIGN 파일을 입력하면 문장 정렬이 수행되지 않습니다. |
Excel 파일 | .XLSX |
Excel 파일(2013 이상). 스프레드시트의 첫 번째 줄/행이 언어 코드여야 합니다. |
사전 형식
사전의 경우, Custom Translator는 훈련 세트에 대해 지원되는 모든 파일 형식을 지원합니다. Excel 사전을 사용하는 경우에는 스프레드시트의 첫 번째 줄/행이 언어 코드여야 합니다.
ZIP 파일 형식
문서를 하나의 zip 파일로 묶어서 업로드할 수 있습니다. Custom Translator는 zip 파일 형식(ZIP
, GZ
, TGZ
)을 지원합니다.
TXT, HTML, HTM, PDF, DOCX, ALIGN 확장명의 zip 파일에서 각 문서는 이 명명 규칙을 따라야 합니다.
{document name}_{language code}: 여기서 {document name}은 문서 이름이고 {language code}는 문서에 해당 언어의 문장이 포함되어 있음을 나타내는 ISO LanguageID(2자)입니다. 언어 코드 앞에는 밑줄(_)이 와야 합니다.
예를 들어 영어-스페인어 시스템을 위해 하나의 zip 내 두 개의 병렬 문서를 업로드하려면 파일 이름을 각각 data_en
과 data_es
로 지정해야 합니다.
번역 메모리 파일(TMX
, XLF
, XLIFF
, LCL
, XLSX
)은 특정 언어 명명 규칙을 따르지 않아도 됩니다.