다음을 통해 공유


Microsoft Fabric의 Data Factory에 있는 이진 형식

이 문서에서는 Data Factory에서 이진 형식을 구성하는 방법을 간략하게 설명합니다.

지원되는 기능

이진 형식은 원본 및 목적지로서 다음 작업과 커넥터에 대해 지원됩니다.

범주 커넥터/작업
지원되는 커넥터 Amazon S3
Amazon S3 호환
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure 파일
파일 시스템
FTP
Google Cloud Storage
HTTP
레이크하우스 파일
Oracle Cloud Storage
SFTP
지원되는 작업 복사 작업(원본/목적지)
GetMetadata 작업
삭제 작업

복사 작업의 이진 형식

이진 형식을 구성하려면 데이터 파이프라인 복사 작업의 원본 또는 목적지에서 연결을 선택한 다음, 파일 형식의 드롭다운 목록에서 Binary를 선택합니다. 이 형식을 추가로 구성하려면 설정을 선택하세요.

파일 설정 버튼을 보여주는 스크린샷

참고 항목

복사 작업에서 이진 형식을 사용하는 경우 원본과 목적지 모두 이진 형식을 사용해야 합니다.

이진을 원본으로

원본 탭 아래의 파일 형식 섹션에서 설정을 선택하면 팝업 파일 형식 설정 대화 상자에 다음 속성이 표시됩니다.

파일 형식 설정을 보여 주는 스크린샷

  • 압축 유형: 이진 파일을 읽는 데 사용되는 압축 코덱입니다. 드롭다운 목록에서 없음, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 유형 중에서 선택할 수 있습니다.

    압축 유형으로 ZipDeflate를 선택하면 원본 탭의 고급 설정 아래에 zip 파일 이름을 폴더로 유지가 표시됩니다.

    • Zip 파일 이름을 폴더로 유지: 원본 Zip 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다.
      • 이 상자를 선택하면(기본값), 서비스는 압축을 푼 파일을 <specified file path>/<folder named as source zip file>/에 씁니다.
      • 이 상자를 선택 취소하면, 서비스는 압축을 푼 파일을 <specified file path>에 직접 씁니다. 경합 또는 예기치 않은 동작을 방지하기 위해, 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.

    압축 유형으로 TarGzip/tar를 선택하면 원본 탭의 고급 설정 아래에 압축 파일 이름을 폴더로 유지가 표시됩니다.

    • 압축 파일 이름을 폴더로 유지: 원본 압축 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다.
      • 이 상자를 선택하면(기본값), 서비스는 압축을 푼 파일을 <specified file path>/<folder named as source compressed file>/에 씁니다.
      • 이 상자를 선택 취소하면, 서비스는 압축을 푼 파일을 <specified file path>에 직접 씁니다. 경합 또는 예기치 않은 동작을 방지하기 위해, 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.
  • 압축 수준: 압축 비율입니다. 최적 또는 가장 빠름 중에서 선택할 수 있습니다.

    • 가장 빠름: 결과 파일이 최적으로 압축되지 않은 경우에도 압축 작업을 최대한 빨리 완료해야 합니다.
    • 최적: 작업이 완료되는데 시간이 오래 걸리더라도 압축 작업이 최적으로 압축되어야 합니다. 자세한 내용을 확인하려면 압축 수준 문서로 이동하세요.

원본 탭의 고급 설정에 이진 형식 관련 속성이 추가로 표시됩니다.

  • 완료 후 파일 삭제: 목적지 저장소로 이동한 후에 원본 저장소에서 이진 파일을 삭제할지를 나타냅니다. 파일 삭제는 파일당입니다. 따라서 복사 작업이 실패하면 일부 파일은 이미 목적지에 복사되어 원본에서 삭제되지만 다른 파일은 원본 저장소에 계속 남아 있습니다.

이진이 목적지인 경우

목적지 탭 아래의 파일 형식 섹션에서 설정을 선택하면 팝업 파일 형식 설정 대화 상자에 다음 속성이 표시됩니다.

파일 형식 선택을 보여 주는 스크린샷

  • 압축 유형: 이진 파일을 쓰는 데 사용되는 압축 코덱입니다. 드롭다운 목록에서 없음, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 유형 중에서 선택할 수 있습니다.

  • 압축 수준: 압축 비율입니다. 최적 또는 가장 빠름 중에서 선택할 수 있습니다.

    • 가장 빠름: 결과 파일이 최적으로 압축되지 않은 경우에도 압축 작업을 최대한 빨리 완료해야 합니다.
    • 최적: 작업이 완료되는데 시간이 오래 걸리더라도 압축 작업이 최적으로 압축되어야 합니다. 자세한 내용을 확인하려면 압축 수준 문서로 이동하세요.

테이블 요약

이진을 원본으로

이진 형식을 사용할 때 복사 작업 원본 섹션에서 지원되는 속성은 다음과 같습니다.

속성 설명 필수 JSON 스크립트 속성
파일 형식 사용하려는 파일 형식입니다. 이진 유형(datasetSettings 에서):
이진
압축 유형 이진 파일을 읽는 데 사용되는 압축 코덱입니다. 다음 중에서 선택합니다.
없음
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
아니요 유형(compression 에서):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
압축 수준 압축 비율입니다. 허용되는 값은 최적 또는 가장 빠름입니다. 최적 또는 가장 빠름 아니요 수준(compression 아래):
가장 빠름
최적
Zip 파일 이름을 폴더로 유지 원본 Zip 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다. 선택됨 또는 선택 해제됨 아니요 preserveZipFileNameAsFolder
(compressionProperties->type 아래 ZipDeflateReadSettings으로)
압축 파일 이름을 폴더로 유지 원본 압축 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다. 선택됨 또는 선택 해제됨 아니요 preserveCompressionFileNameAsFolder
(compressionProperties->type 아래 TarGZipReadSettings 또는 TarReadSettings으로)
완료 후 파일 삭제 목적지 저장소로 성공적으로 이동한 후 이진 파일이 원본 저장소에서 삭제되는지 여부를 나타냅니다. 선택됨 또는 선택 해제됨 아니요 deleteFilesAfterCompletion:
true 또는 false

이진이 목적지인 경우

이진 형식을 사용할 때 복사 작업 목적지 섹션에서 다음 속성이 지원됩니다.

속성 설명 필수 JSON 스크립트 속성
파일 형식 사용하려는 파일 형식입니다. 이진 유형(datasetSettings 에서):
이진
압축 유형 이진 파일을 쓰는 데 사용되는 압축 코덱입니다. 다음 중에서 선택합니다.
없음
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
아니요 유형(compression 에서):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
압축 수준 압축 비율입니다. 허용되는 값은 최적 또는 가장 빠름입니다. 최적 또는 가장 빠름 아니요 수준(compression 아래):
가장 빠름
최적