Azure Data Lake Store와 Azure Blob Storage 비교

완료됨

Azure Blob Storage에서는 대량의 비정형("개체") 데이터를 Blob 컨테이너 내의 단일 구조 네임스페이스에 저장할 수 있습니다. Blob 이름에는 Blob을 가상 "폴더"로 구성하는 "/" 문자가 포함될 수 있지만 Blob 관리 효율성 측면에서 Blob은 단일 구조 네임스페이스에 단일 수준 계층 구조로 저장됩니다.

단일 구조 네임스페이스가 있는 Blob 저장소의 다이어그램

HTTP 또는 HTTPs를 사용하여 이 데이터에 액세스할 수 있습니다.

Azure Data Lake Storage Gen2는 Blob Storage를 기반으로 하며 Blob 데이터를 디렉터리로 구성하고 각 디렉터리와 그 안에 있는 파일에 대한 메타데이터를 저장하는 계층 구조 네임스페이스를 사용하여 대용량 데이터의 I/O를 최적화합니다. 이 구조를 사용하면 디렉터리 이름 바꾸기 및 삭제와 같은 작업을 단일 원자성 작업으로 수행할 수 있습니다. 반면, 단일 구조 네임스페이스에는 구조의 개체의 수에 비례한 몇 가지 작업이 필요합니다. 계층 구조 네임스페이스는 데이터를 체계적으로 유지하므로 분석 사용 사례의 스토리지 및 검색 성능이 향상되고 분석 비용이 절감됩니다.

계층 구조 네임스페이스가 있는 Blob 저장소의 다이어그램

데이터 분석을 수행하지 않고 데이터를 저장하려면 계층 구조 네임스페이스 옵션을 사용 안 함으로 설정하여 스토리지 계정을 Azure Blob 스토리지 계정으로 설정합니다. 또한 Blob 스토리지를 사용하여 거의 사용하지 않는 데이터를 보관하거나 이미지 및 미디어와 같은 웹 사이트 자산을 저장할 수도 있습니다.

데이터 분석을 수행하는 경우 계층 구조 네임스페이스 옵션을 사용으로 설정하여 스토리지 계정을 Azure Data Lake Storage Gen2 계정으로 설정합니다. Azure Data Lake Storage Gen2는 Azure Storage 플랫폼에 통합되므로 애플리케이션에서 Blob API 또는 Azure Data Lake Storage Gen2 파일 시스템 API를 사용하여 데이터에 액세스할 수 있습니다.