Blob 스토리지에 대한 성능 및 확장성 검사 목록
Microsoft는 Blob 스토리지를 사용하여 고성능 애플리케이션을 개발하는 방법에 관해 검증된 다양한 사례를 개발했습니다. 이 검사 목록에서는 개발자가 성능을 최적화하기 위해 수행할 수 있는 주요 사례를 식별합니다. 애플리케이션을 설계하는 동안 프로세스 전체에서 이러한 사례를 명심하세요.
Azure Storage에는 용량, 트랜잭션 속도 및 대역폭에 대한 확장성 및 성능 목표가 있습니다. Azure Storage 스케일링 성능 목표에 대한 자세한 내용은 표준 스토리지 계정의 확장성 및 성능 목표 및 Blob 스토리지의 확장성 및 성능 목표를 참조하세요.
검사 목록
이 문서에서는 성능에 대해 검증된 사례를 Blob 스토리지 애플리케이션 개발 중에 수행할 수 있는 검사 목록으로 구성합니다.
확장성 목표
애플리케이션이 확장성 목표에 도달하거나 목표를 초과하는 경우 트랜잭션 대기 시간이 길어지거나 제한이 증가할 수 있습니다. Azure Storage에서 애플리케이션을 제한하면 서비스에서 503(서버 작업 중) 또는 500(작업 시간 제한) 오류 코드를 반환하기 시작합니다. 확장성 목표의 한도 내에서 유지하여 이러한 오류를 방지하는 것은 애플리케이션의 성능을 향상시키는 데 중요한 부분입니다.
큐 서비스의 확장성 목표에 대한 자세한 내용은 Azure Storage 확장성 및 성능 목표를 참조하세요.
최대 스토리지 계정 수
특정 구독/지역 조합에 허용되는 최대 스토리지 계정 수와 가까워지는 경우 시나리오를 평가하고 다음 조건이 적용되는지 여부를 확인합니다.
- 스토리지 계정을 사용하여 비관리 디스크를 저장하고 해당 디스크를 VM(가상 머신)에 추가하고 있나요? 이 시나리오에서 Microsoft는 관리 디스크 사용을 권장합니다. 관리 디스크는 개별 스토리지 계정을 만들고 관리할 필요 없이 자동으로 스케일링됩니다. 자세한 내용은 Azure Managed Disks 소개를 참조하세요.
- 데이터 격리 목적으로 고객당 하나의 스토리지 계정을 사용하고 있나요? 이 시나리오에서 Microsoft는 전체 스토리지 계정 대신 각 고객에 대한 Blob 컨테이너 사용을 권장합니다. 이제 Azure Storage를 사용하여 컨테이너별로 Azure 역할을 할당할 수 있습니다. 자세한 내용은 Blob 데이터에 액세스하기 위한 Azure 역할 할당을 참조하세요.
- 수신, 송신, IOPS(초당 I/O 작업) 또는 용량을 늘리기 위해 여러 스토리지 계정을 사용하여 분할하고 있나요? 이 시나리오에서는 가능한 경우 워크로드에 필요한 스토리지 계정 수를 줄이기 위해 스토리지 계정에 대한 제한을 늘리는 것이 좋습니다. 스토리지 계정에 대한 제한을 늘리도록 요청하려면 Azure 지원에 문의하세요.
용량 및 트랜잭션 목표
애플리케이션이 특정 스토리지 계정의 확장성 목표에 도달한 경우 다음 방법 중 하나를 사용할 수 있습니다.
- 애플리케이션이 트랜잭션 대상에 도달하는 경우 높은 트랜잭션 속도 및 낮은 대기 시간에 최적화된 블록 Blob 스토리지 계정을 사용하는 것이 좋습니다. 자세한 내용은 Azure Storage 계정 개요를 참조하세요.
- 애플리케이션이 확장성 목표에 도달하거나 목표를 초과한 원인이 되는 워크로드를 다시 고려합니다. 즉, 대역폭이나 용량을 더 적게 사용하거나 트랜잭션을 더 적게 수행하도록 해당 작업을 다시 디자인할 수 있는지를 파악합니다.
- 애플리케이션에서 확장성 목표 중 하나를 초과해야 하는 경우 여러 스토리지 계정을 만들어 애플리케이션 데이터를 해당 스토리지 계정에 분할합니다. 이러한 패턴을 사용하는 경우에는 향후 부하 분산을 위해 스토리지 계정을 더 추가할 수 있도록 애플리케이션을 디자인해야 합니다. 스토리지 계정 자체에는 저장된 데이터, 수행된 트랜잭션 또는 전송된 데이터와 관련된 사용량 이외의 비용은 없습니다.
- 애플리케이션의 대역폭 목표에 도달하는 경우 클라이언트 쪽의 데이터를 압축하여 Azure Storage에 보내는 데 필요한 대역폭을 줄이는 것이 좋습니다. 데이터를 압축하면 대역폭이 절약되고 네트워크 성능이 향상될 수 있지만 성능에 부정적인 영향을 미칠 수도 있습니다. 클라이언트 쪽의 데이터 압축 및 압축 풀기에 대한 추가 처리 요구 사항으로 인해 성능에 미치는 영향을 평가합니다. 압축된 데이터를 저장하면 표준 도구를 사용하여 데이터를 보는 것이 더 어려울 수 있으므로 문제 해결이 더 어려워 질 수 있습니다.
- 애플리케이션에서 확장성 목표에 도달하는 경우 재시도에 대해 지수 백오프를 사용하고 있는지 확인합니다. 이 문서에서 설명하는 추천 사항을 구현하여 확장성 목표에 도달하지 않도록 하는 것이 가장 좋습니다. 그러나 지수 백오프를 재시도에 사용하면 애플리케이션에서 빠르게 다시 시도하지 못하므로 제한 성능이 저하될 수 있습니다. 자세한 내용은 시간 제한 및 서버 작업 중 오류 섹션을 참조하세요.
동시에 단일 Blob에 액세스하는 여러 클라이언트
단일 Blob에 동시에 액세스하는 클라이언트 수가 많은 경우 Blob 및 스토리지 계정 스케일링 성능 목표를 모두 고려해야 합니다. 단일 Blob에 액세스할 수 있는 정확한 클라이언트 수는 Blob을 동시에 요청하는 클라이언트 수, Blob 크기, 네트워크 상태와 같은 요소에 따라 달라집니다.
웹 사이트에서 제공된 이미지 또는 동영상과 같은 CDN을 통해 Blob을 배포할 수 있는 경우 CDN을 사용할 수 있습니다. 자세한 내용은 콘텐츠 배포라는 제목의 섹션을 참조하세요.
데이터가 기밀인 과학 시뮬레이션과 같은 기타 시나리오에서는 두 가지 옵션을 사용할 수 있습니다. 첫 번째는 Blob이 동시에 액세스되는 대신 일정 기간 액세스되도록 워크로드의 액세스에 시차를 두는 것입니다. 또는 Blob을 여러 스토리지 계정에 임시로 복사하여 Blob당 및 스토리지 계정 간 총 IOPS를 늘릴 수 있습니다. 결과는 애플리케이션의 동작에 따라 달라지므로 디자인 중에 동시성 패턴을 테스트해야 합니다.
Blob당 대역폭 및 작업
단일 Blob은 요청을 초당 500개까지 지원합니다. 동일한 Blob을 읽어야 하는 여러 클라이언트가 있고 이 한도를 초과할 수 있는 경우 블록 Blob 스토리지 계정을 사용하는 것이 좋습니다. 블록 Blob 스토리지 계정은 더 높은 요청 속도 또는 IOPS(초당 I/O 작업)를 제공합니다.
Azure CDN과 같은 CDN(Content Delivery Network)을 사용하여 Blob에 작업을 배포할 수도 있습니다. Azure CDN에 대한 자세한 내용은 Azure CDN 개요를 참조하세요.
분할
성능을 향상하기 위해 Azure Storage에서 Blob 데이터를 분할하는 방법을 이해하는 것이 유용합니다. Azure Storage는 여러 파티션에 걸쳐 있는 데이터보다 단일 파티션의 데이터를 더 빠르게 제공할 수 있습니다. Blob의 이름을 적절하게 지정하면 읽기 요청의 효율성을 개선할 수 있습니다.
Blob 스토리지는 스케일링과 부하 분산을 위해 범위 기반 분할 구성표를 사용합니다. 각 Blob에는 전체 Blob 이름(계정 + 컨테이너 + Blob)으로 구성된 파티션 키가 있습니다. 파티션 키는 Blob 데이터를 범위로 분할하는 데 사용됩니다. 그러면 범위는 Blob 스토리지에서 부하가 분산됩니다.
범위 기반 분할은 어휘 순서(예: mypayroll, myperformance, myemployees 등) 또는 타임스탬프(log20160101, log20160102, log20160102 등)를 사용하는 명명 규칙으로 인해 부하가 증가하여 더 작은 범위로 분할되어야 할 때까지 파티션이 동일한 파티션 서버에 함께 배치될 가능성이 더 높다는 것을 의미합니다. 동일한 파티션 서버에서 Blob을 공동 배치하면 성능에 영향을 주므로 성능 향상의 중요한 부분에는 Blob을 가장 효과적으로 구성하는 방식으로 명명하는 작업이 포함됩니다.
예를 들어 컨테이너 내 모든 Blob는 이러한 Blob의 부하가 파티션 범위의 추가 리밸런싱을 요구하기 전까지 단일 서버가 지원할 수 있습니다. 마찬가지로, 이름이 어휘 순서로 정렬된 가벼운 부하의 계정 그룹도 하나 또는 전체 계정의 부하에서 여러 파티션 서버로 분할이 요구될 때까지 단일 서버에서 지원할 수 있습니다.
각 부하 분산 작업은 작업 중 스토리지 호출의 대기 시간에 영향을 미칠 수 있습니다. 파티션에 대한 트래픽 급증을 처리하는 서비스 기능은 부하 분산 작업이 시작되고 파티션 키 범위를 리밸런스할 때까지 단일 파티션 서버의 스케일링 성능에 따라 제한될 수 있습니다.
이러한 작업의 빈도를 줄이려면 몇 가지 모범 사례를 따르십시오.
가능하다면 표준 및 프리미엄 스토리지 계정에는 256KiB보다 큰 Blob 또는 블록 크기를 사용합니다. 더 큰 Blob 또는 블록 크기는 자동으로 처리량이 많은 블록 Blob을 활성화합니다. 처리량이 높은 블록 Blob은 파티션 명명에 영향을 받지 않는 고성능 수집을 제공합니다.
계정, 컨테이너, Blob, 테이블, 큐에 사용하는 명명 규칙을 검사합니다. 요구 사항에 가장 적합한 해시 함수를 사용하여 세 자리 해시로 계정, 컨테이너 또는 Blob 이름을 접두사로 지정하는 것이 좋습니다.
타임스탬프 또는 숫자 식별자를 사용하여 데이터를 정리하는 경우 추가만 가능한(또는 앞에만 추가할 수 있는) 트래픽 패턴을 사용하지 않아야 합니다. 이러한 패턴은 범위 기반 분할 시스템에 적합하지 않습니다. 이러한 패턴으로 인해 모든 트래픽이 단일 파티션으로 이동하고 시스템의 효과적인 부하 분산이 제한될 수 있습니다.
예를 들어 일상적인 작업에서 타임스탬프(예: yyyymmdd)가 포함된 Blob을 사용하는 경우 이러한 일상적인 작업의 모든 트래픽이 단일 파티션 서버에서 지원하는 단일 Blob으로 전송될 수 있습니다. Blob당 한계와 파티션당 한계가 요구 사항을 충족하는지 확인하고 필요에 따라 이 작업을 여러 Blob으로 나누는 것을 고려하세요. 마찬가지로 테이블에 시계열 데이터를 저장하는 경우 모든 트래픽이 키 네임스페이스의 마지막 부분으로 전송될 수 있습니다. 숫자 ID를 사용하는 경우 3자리 해시를 사용하여 ID에 접두사를 붙입니다. 타임스탬프를 사용하는 경우 타임스탬프에 초 값(예: ssyyyymmdd)을 접두사로 사용합니다. 애플리케이션에서 정기적으로 나열 및 쿼리 작업을 수행하는 경우 쿼리 수를 제한하는 해시 알고리즘을 선택합니다. 임의의 접두사만으로도 충분한 경우도 있을 수 있습니다.
Azure Storage에서 사용되는 분할 구성표에 대한 자세한 내용은 Azure Storage: 일관성과 고가용성 클라우드 스토리지 서비스를 참조하세요.
네트워킹
애플리케이션의 실제 네트워크 제약 조건은 성능에 큰 영향을 미칠 수 있습니다. 다음 섹션에서는 사용자에게 발생할 수 있는 몇 가지 제한 사항에 대해 설명합니다.
클라이언트 네트워크 기능
다음 섹션에서 설명한 대로 네트워크 링크의 대역폭과 품질은 애플리케이션 성능에서 중요한 역할을 합니다.
처리량
대역폭의 경우에는 클라이언트 기능에 문제가 있는 경우가 많습니다. 대규모 Azure 인스턴스에는 용량이 더 많은 NIC가 포함되므로 머신 하나의 네트워크 한도를 높여야 하는 경우에는 더 큰 인스턴스나 더 많은 VM을 사용하는 것이 좋습니다. 온-프레미스 애플리케이션에서 Azure Storage에 액세스하는 경우에도 동일한 규칙이 적용됩니다. 즉, 클라이언트 디바이스의 네트워크 기능과 Azure Storage 위치에 대한 네트워크 연결을 파악하고, 필요한 경우 이를 향상시키거나 해당 기능 내에서 작동하도록 애플리케이션을 디자인해야 합니다.
링크 품질
네트워크 사용량과 마찬가지로 네트워크 조건으로 인해 오류와 패킷 손실이 발생하면 효과적인 처리량의 속도가 느려집니다. WireShark 또는 NetMon을 사용하면 이 문제를 진단하는 데 도움이 될 수 있습니다.
위치
모든 분산 환경에서는 클라이언트를 서버 근처에 배치하면 성능을 최대화할 수 있습니다. Azure Storage 액세스 시 대기 시간을 최소화하려는 경우에는 클라이언트를 같은 Azure 지역 내에 배치하는 것이 가장 좋습니다. 예를 들어 Azure 웹앱에서 Azure Storage를 사용하는 경우 웹앱과 스토리지를 모두 단일 하위 지역(예: 미국 서부 또는 동남 아시아) 내에 배치합니다. 리소스를 공동 배치하면 단일 지역 내의 대역폭 사용량이 무료이므로 대기 시간과 비용이 줄어듭니다.
모바일 디바이스 앱 또는 온-프레미스 엔터프라이즈 서비스와 같이 클라이언트 애플리케이션이 Azure Storage에 액세스하지만 Azure 내에서 호스팅되지 않는 경우 스토리지 계정을 해당 클라이언트와 가까운 지역에 배치하면 대기 시간을 줄일 수 있습니다. 고객이 광범위하게 분산되어 있는 경우(예: 북아메리카 및 유럽 일부) 지역당 하나의 스토리지 계정을 사용하는 것이 좋습니다. 애플리케이션에서 개별 사용자 관련 데이터를 저장하며 스토리지 계정 간에 데이터를 복제하지 않아도 되는 경우 이 방식을 보다 쉽게 구현할 수 있습니다.
Blob 콘텐츠를 광범위하게 배포하려면 Azure CDN과 같은 콘텐츠 배달 네트워크를 사용합니다. Azure CDN에 대한 자세한 내용은 Azure CDN을 참조하세요.
SAS 및 CORS
Azure Storage의 데이터에 액세스할 수 있는 권한을 코드(예: 사용자의 웹 브라우저 또는 휴대폰 앱에서 실행되는 JavaScript)에 부여해야 한다고 가정합니다. 한 가지 방법은 프록시로 작동하는 서비스 애플리케이션을 구축하는 것입니다. 사용자의 디바이스는 서비스를 인증하여 Azure Storage 리소스에 대한 액세스 권한을 부여합니다. 이러한 방식을 사용하면 안전하지 않은 디바이스에서 스토리지 계정 키가 노출되는 상황을 방지할 수 있습니다. 그러나 이 방법은 사용자의 디바이스와 Azure Storage 간에 전송되는 모든 데이터가 서비스 애플리케이션을 통과해야 하므로 서비스 애플리케이션에 상당한 오버헤드가 발생합니다.
SAS(공유 액세스 서명)를 사용하여 서비스 애플리케이션을 Azure Storage의 프록시로 사용하지 않도록 방지할 수 있습니다. SAS를 사용하면 제한된 액세스 토큰을 사용하여 사용자의 디바이스에서 Azure Storage에 직접 요청할 수 있습니다. 예를 들어 사용자가 사진을 애플리케이션에 업로드하려는 경우 서비스 애플리케이션에서 SAS를 생성하여 사용자의 디바이스로 보낼 수 있습니다. SAS 토큰은 지정된 시간 간격 동안 Azure Storage 리소스에 쓸 수 있는 권한을 부여할 수 있으며, 그 후에는 SAS 토큰이 만료됩니다. SAS에 대한 자세한 내용은 SAS(공유 액세스 서명)를 사용하여 Azure Storage 리소스에 대한 제한된 액세스 권한 부여를 참조하세요.
일반적으로 웹 브라우저는 한 도메인의 웹 사이트에서 호스팅하는 페이지의 JavaScript에서 다른 도메인에 대한 쓰기 작업과 같은 특정 작업을 수행할 수 없습니다. 동일한 원본 정책이라고 하는 이 정책은 한 페이지의 악성 스크립트에서 다른 웹 페이지의 데이터에 액세스하지 못하도록 방지합니다. 그러나 클라우드에서 솔루션을 구축하는 경우 동일한 원본 정책이 제한될 수 있습니다. CORS(원본 간 리소스 공유)는 대상 도메인이 원본 도메인에서 시작된 요청을 신뢰하는 브라우저와 통신할 수 있게 하는 브라우저 기능입니다.
예를 들어 Azure에서 실행되는 웹 애플리케이션에서 Azure Storage 계정에 리소스를 요청한다고 가정합니다. 웹 애플리케이션은 원본 도메인이고, 스토리지 계정은 대상 도메인입니다. Azure Storage에서 원본 도메인의 요청을 신뢰하는 웹 브라우저와 통신하도록 모든 Azure Storage 서비스에 대해 CORS를 구성할 수 있습니다. CORS에 대한 자세한 내용은 Azure Storage에 대한 CORS(원본 간 리소스 공유) 지원을 참조하세요.
SAS 및 CORS는 모두 웹 애플리케이션에서 불필요한 로드를 방지하는 데 도움이 될 수 있습니다.
캐싱
캐싱은 성능에 있어 중요합니다. 다음 섹션에서는 캐싱 모범 사례에 관해 설명합니다.
데이터 읽기
일반적으로 데이터를 한 번 읽는 것이 데이터를 두 번 읽는 것보다 좋습니다. 사용자에게 콘텐츠로 제공하기 위해 Azure Storage에서 50MiB의 Blob을 검색한 웹 애플리케이션의 예제를 고려합니다. 애플리케이션이 Blob을 로컬에서 디스크에 캐시한 다음, 후속 사용자 요청에 대해 캐시된 버전을 검색하는 것이 가장 좋습니다.
Blob이 캐시된 이후 수정되지 않은 경우 Blob 검색을 방지하는 한 가지 방법은 수정 시간에 대한 조건부 헤더를 사용하여 가져오기 작업을 정규화하는 것입니다. 마지막으로 수정한 시간이 Blob이 캐시된 시간 이후인 경우 Blob이 검색되고 다시 캐시됩니다. 그렇지 않은 경우 최적의 성능을 위해 캐시된 Blob이 검색됩니다.
Blob을 검색한 후에는 잠시 Blob이 변경되지 않은 상태로 유지되도록 애플리케이션을 디자인할 수도 있습니다. 이때 애플리케이션은 해당 기간에 Blob이 수정되었는지 여부를 확인할 필요가 없습니다.
애플리케이션에서 자주 사용하는 구성 데이터, 조회 데이터, 기타 데이터는 캐싱에 적합한 후보입니다.
조건부 헤더 사용 방법에 대한 자세한 내용은 Blob service 작업의 조건부 헤더 지정을 참조하세요.
데이터 일괄 업로드
일부 시나리오에서는 데이터를 로컬로 집계한 다음, 각 데이터 부분을 즉시 업로드하는 대신 주기적으로 일괄 업로드할 수 있습니다. 예를 들어 웹 애플리케이션에서 작업의 로그 파일을 유지한다고 가정합니다. 애플리케이션은 테이블에 발생하는 모든 활동의 세부 정보를 업로드하거나(많은 스토리지 작업이 필요함) 활동 세부 정보를 로컬 로그 파일에 저장하고 모든 활동 세부 정보를 구분된 파일로 Blob에 주기적으로 업로드할 수 있습니다. 각 로그 항목의 크기가 1KB인 경우 단일 트랜잭션에서 수천 개의 항목을 업로드할 수 있습니다. 단일 트랜잭션은 최대 64MiB 크기의 Blob 업로드를 지원합니다. 애플리케이션 개발자는 클라이언트 디바이스 또는 업로드 실패의 가능성을 염두에 두고 디자인해야 합니다. 활동 데이터를 단일 활동이 아닌 시간 간격으로 다운로드해야 하는 경우 Table Storage보다는 Blob 스토리지를 사용하는 것이 좋습니다.
.NET 구성
이 섹션에서는 .NET Framework를 사용하는 프로젝트에서 성능을 크게 개선하기 위해 사용할 수 있는 몇 가지 빠른 구성 설정을 소개합니다. .NET 이외의 언어를 사용하는 경우에는 선택한 언어에 비슷한 개념이 적용되는지를 확인하세요.
기본 연결 제한 늘리기
참고 항목
연결 풀링은 ServicePointManager 클래스에서 제어하므로 이 섹션은 .NET Framework를 사용하는 프로젝트에 적용됩니다. .NET Core는 연결 풀 관리와 관련하여 상당한 변화를 도입했습니다. 여기서 연결 풀은 HttpClient 수준에서 발생하고 풀 크기는 기본적으로 제한되지 않습니다. 즉, HTTP 연결은 워크로드를 충족하도록 자동으로 크기가 조정됩니다. 성능 향상을 활용하려면 가능한 경우 최신 버전의 .NET을 사용하는 것이 좋습니다.
.NET Framework를 사용하는 프로젝트에서는 다음 코드를 사용하여 기본 연결 제한(일반적으로 클라이언트 환경에서는 2이고, 서버 환경에서는 10임)을 100으로 늘릴 수 있습니다. 일반적으로 이 값을 애플리케이션에서 사용되는 대략적인 스레드 수로 설정해야 합니다. 연결을 열기 전에 연결 제한을 설정합니다.
ServicePointManager.DefaultConnectionLimit = 100; //(Or More)
.NET Framework의 연결 풀 제한에 대한 자세한 내용은 .NET Framework 연결 풀 제한 및 .NET용 새 Azure SDK를 참조하세요.
기타 프로그래밍 언어의 경우 설명서에서 연결 제한을 설정하는 방법을 확인하세요.
최소 스레드 수 늘리기
비동기 작업에서 동기 호출을 함께 사용하는 경우 스레드 풀의 스레드 수를 늘릴 수 있습니다.
ThreadPool.SetMinThreads(100,100); //(Determine the right number for your application)
자세한 내용은 ThreadPool.SetMinThreads 메서드를 참조하세요.
무제한 병렬 처리
병렬 처리는 성능에 매우 유용할 수 있지만, 스레드 수 또는 병렬 처리 요청 수가 제한되지 않는 무제한 병렬 처리를 사용하는 데 주의해야 합니다. 데이터를 업로드하거나 다운로드하거나, 동일한 스토리지 계정의 여러 파티션에 액세스하거나, 동일한 파티션의 여러 항목에 액세스하기 위한 병렬 요청은 제한해야 합니다. 무제한 병렬 처리인 경우 애플리케이션에서 클라이언트 디바이스의 기능 또는 스토리지 계정의 확장성 목표를 초과하여 대기 시간과 제한이 길어질 수 있습니다.
클라이언트 라이브러리 및 도구
최상의 성능을 위해 항상 Microsoft에서 제공하는 최신 클라이언트 라이브러리와 도구를 사용합니다. Azure Storage 클라이언트 라이브러리는 다양한 언어로 사용할 수 있습니다. 또한 Azure Storage는 PowerShell 및 Azure CLI도 지원합니다. Microsoft는 성능을 고려하여 이러한 클라이언트 라이브러리와 도구를 적극적으로 개발하고, 최신 서비스 버전으로 해당 도구를 최신 상태로 유지하며, 이를 통해 검증된 여러 성능 사례를 내부적으로 처리하고 있습니다.
팁
ABFS 드라이버는 WASB의 고유한 결함을 해결하도록 설계되었습니다. ABFS 드라이버는 특히 빅 데이터 분석에 최적화되어 있으므로 WASB 드라이버보다 ABFS 드라이버를 사용하는 것이 좋습니다.
서비스 오류 처리
서비스에서 요청을 처리할 수 없는 경우 Azure Storage는 오류를 반환합니다. 지정된 시나리오에서 Azure Storage가 반환할 수 있는 오류를 이해하면 성능을 최적화하는 데 도움이 됩니다. 일반적인 오류 코드 목록은 일반 REST API 오류 코드를 참조하세요.
시간 제한 및 서버 사용 중 오류
확장성 제한에 도달하면 Azure Storage에서 애플리케이션을 제한할 수 있습니다. Azure Storage에서 일시적인 조건으로 인해 요청을 처리하지 못하는 경우도 있습니다. 두 경우 모두 서비스에서 503(서버 작업 중) 또는 500(시간 제한) 오류를 반환할 수 있습니다. 이러한 오류는 서비스에서 처리량을 높이기 위해 데이터 파티션을 균형 있게 다시 분산시키는 경우에도 발생할 수 있습니다. 클라이언트 애플리케이션은 일반적으로 이러한 오류 중 하나가 발생되는 작업을 다시 시도해야 합니다. 그러나 애플리케이션에서 확장성 목표를 초과하여 Azure Storage에서 애플리케이션을 제한하는 경우 또는 서비스에서 다른 이유로 요청을 처리할 수 없었던 경우에도 적극적인 재시도로 인해 문제가 악화될 수 있습니다. 지수 백오프 재시도 정책을 사용하는 것이 좋으며, 클라이언트 라이브러리는 기본적으로 이 동작으로 설정됩니다. 예를 들어, 애플리케이션은 2초, 4초, 10초, 30초 후에 다시 시도한 다음 완전히 포기할 수 있습니다. 이렇게 하면 애플리케이션에서 제한으로 이어질 수 있는 동작을 악화시키는 대신 서비스에 대한 부하를 크게 줄입니다.
연결 오류는 제한으로 인해 발생하는 것이 아니라 일시적이므로 즉시 다시 시도할 수 있습니다.
다시 시도할 수 없는 오류
클라이언트 라이브러리는 다시 시도할 수 있는 오류와 다시 시도할 수 없는 오류를 인식하여 재시도를 처리합니다. 그러나 Azure Storage REST API를 직접 호출하는 경우에는 다시 시도하지 않아야 하는 오류가 있습니다. 예를 들어 400(잘못된 요청) 오류는 클라이언트 애플리케이션에서 예상되지 않은 형식으로 인해 처리할 수 없는 요청을 보냈음을 나타냅니다. 이 요청을 다시 보내면 매번 동일한 응답이 발생하므로 다시 시도할 필요가 없습니다. Azure Storage REST API를 직접 호출하는 경우 잠재적 오류와 재시도 여부를 알고 있어야 합니다.
Azure Storage 오류 코드에 대한 자세한 내용은 상태 및 오류 코드를 참조하세요.
Blob 복사 및 이동
Azure Storage는 스토리지 계정, 스토리지 계정 간, 온-프레미스 시스템 및 클라우드 간에 Blob을 복사하고 이동시키는 여러 솔루션을 제공합니다. 이 섹션에서는 성능에 미치는 관해 기준으로 이러한 옵션 중 일부에 대해 설명합니다. Blob 스토리지로 또는 Blob 스토리지에서 데이터를 효율적으로 전송하는 방법에 대한 자세한 내용은 데이터 전송을 위한 Azure 솔루션 선택을 참조하세요.
Blob 복사 API
스토리지 계정 간에 Blob을 복사하려면 URL에서 블록 배치 작업을 사용합니다. 이 작업을 수행하면 모든 URL 원본에서 블록 Blob으로 데이터를 동기적으로 복사합니다. Put Block from URL
작업을 사용하면 스토리지 계정 간에 데이터를 마이그레이션하는 경우 필요한 대역폭이 크게 줄어들 수 있습니다. 복사 작업은 서비스 쪽에서 수행되므로 데이터를 다운로드하고 다시 업로드할 필요가 없습니다.
동일한 스토리지 계정 내에서 데이터를 복사하려면 Blob 복사 작업을 사용합니다. 동일한 스토리지 계정 내의 데이터 복사는 일반적으로 신속하게 완료됩니다.
AzCopy 사용
AzCopy 명령줄 유틸리티는 스토리지 계정으로/계정에서/계정 간에 Blob을 대량으로 전송하기 위한 간단하고 효율적인 옵션입니다. AzCopy는 이러한 시나리오에 최적화되어 있으며 빠른 전송 속도를 달성할 수 있습니다. AzCopy 버전 10은 Put Block From URL
작업을 사용하여 스토리지 계정 간에 Blob 데이터를 복사합니다. 자세한 내용은 AzCopy v10을 사용하여 Azure Storage에 데이터 복사 또는 이동을 참조하세요.
Use Azure Data Box
대량의 데이터를 Blob 스토리지로 가져오려면 오프라인 전송을 위해 Azure Data Box 제품군을 사용하는 것이 좋습니다. Microsoft에서 제공하는 Data Box 디바이스는 시간, 네트워크 가용성 또는 비용이 제한된 경우 Azure로 대량의 데이터를 이동하는 데 적합합니다. 자세한 내용은 Azure DataBox 설명서를 참조하세요.
콘텐츠 배포
애플리케이션이 같은 지역이나 여러 지역의 많은 사용자에게 동일한 콘텐츠(예: 웹 사이트의 홈페이지에 사용되는 제품 데모 비디오)를 제공해야 하는 경우가 있습니다. 이 시나리오에서는 Azure Front Door와 같은 CDN(Content Delivery Network)을 사용합니다. Azure Front Door는 전 세계 사용자와 애플리케이션의 정적 및 동적 웹 콘텐츠 간에 빠르고 안정적이며 안전한 액세스를 제공하는 Microsoft의 최신 클라우드 CDN입니다. Azure Front Door는 수백 개의 글로벌 및 로컬 PoP(존재 지점)가 있는 Microsoft의 글로벌 에지 네트워크를 사용하여 Blob Storage 콘텐츠를 제공합니다. CDN은 일반적으로 단일 스토리지 계정보다 훨씬 더 높은 송신 제한을 지원할 수 있으며 다른 지역으로의 콘텐츠 배달 대기 시간을 향상합니다.
Azure Front Door에 대한 자세한 내용은 Azure Front Door를 참조하세요.
메타데이터 사용
Blob service는 Blob 속성 또는 메타데이터를 포함할 수 있는 HEAD 요청을 지원합니다. 예를 들어 애플리케이션이 사진에서 Exif(교환 가능 이미지 형식) 데이터를 필요로 하는 경우 사진을 검색하고 추출할 수 있습니다. 애플리케이션은 대역폭을 절약하고 성능을 개선하기 위해 애플리케이션에서 사진을 업로드하는 경우 Exif 데이터를 Blob의 메타데이터에 저장할 수 있습니다. 그런 다음 HEAD 요청만을 사용하여 메타데이터에서 Exif 데이터를 검색할 수 있습니다. Blob의 전체 콘텐츠가 아닌 메타데이터만 검색하는 경우에는 상당한 대역폭이 절약되며 Exif 데이터를 추출하는 데 필요한 처리 시간이 줄어듭니다. Blob당 8KiB의 메타데이터를 저장할 수 있다는 점을 기억하세요.
계정 및 컨테이너 메타데이터 업데이트
계정 및 컨테이너 메타데이터는 계정이 있는 지역의 스토리지 서비스에 전파됩니다. 이 메타데이터의 전체 전파는 작업에 따라 최대 60초가 걸릴 수 있습니다. 예시:
- 동일한 지역에 동일한 계정 이름을 사용하여 계정을 빠르게 만들고 삭제하고 다시 만드는 경우 계정 상태가 완전히 전파되기까지 60초 동안 기다려야 합니다. 그렇지 않으면 요청이 실패할 수 있습니다.
- 컨테이너에서 저장된 액세스 정책을 설정할 경우 정책이 적용되는 데 최대 30초까지 걸릴 수 있습니다.
데이터 전송 성능 조정
애플리케이션이 Azure Storage 클라이언트 라이브러리를 사용하여 데이터를 전송하는 경우 속도, 메모리 사용량, 요청의 성공 또는 실패에도 영향을 줄 수 있는 몇 가지 요인이 있습니다. 데이터 전송 성능과 안정성을 극대화하려면 앱이 실행되는 환경에 따라 클라이언트 라이브러리 전송 옵션을 사전에 구성하는 것이 중요합니다. 자세한 내용은 업로드 및 다운로드에 대한 성능 조정을 참조하세요.
빠르게 Blob 업로드
Blob을 빠르게 업로드하려면 먼저 하나의 Blob을 업로드할지 여러 Blob을 업로드할지 여부를 결정합니다. 아래 지침을 참고하여 시나리오에 따라 사용할 적절한 방법을 결정합니다. 데이터 전송에 Azure Storage 클라이언트 라이브러리를 사용하는 경우 추가 지침은 데이터 전송 성능 조정을 참조하세요.
큰 Blob 하나를 빠르게 업로드
큰 Blob 하나를 빠르게 업로드하려는 경우 클라이언트 애플리케이션은 블록이나 페이지를 병렬로 업로드할 수 있습니다. 이때 개별 Blob의 스케일링 성능 목표와 스토리지 계정의 전체 스케일링 성능 목표를 모두 고려해야 합니다. Azure Storage 클라이언트 라이브러리는 병렬 업로드를 지원합니다. 지원되는 다른 언어에 대한 클라이언트 라이브러리는 유사한 옵션을 제공합니다.
많은 Blob을 빠르게 업로드
Blob 여러 개를 빠르게 업로드하려면 Blob을 병렬로 업로드합니다. 병렬 업로드는 병렬 블록 업로드를 통해 Blob을 하나씩 업로드하는 것보다 빠릅니다. 스토리지 서비스의 여러 파티션으로 업로드가 분산되기 때문입니다. 이 시나리오에서는 기본적으로 업로드를 병렬로 수행하는 AzCopy를 사용하는 것이 좋습니다. 자세한 내용은 AzCopy 시작을 참조하세요.
적절한 Blob 유형 선택
Azure Storage는 블록 Blob, 추가 Blob, 페이지 Blob을 지원합니다. 지정된 사용 시나리오에 대해 선택하는 Blob 유형은 솔루션의 성능과 확장성에 영향을 줍니다.
블록 Blob은 많은 양의 데이터를 효율적으로 업로드하려는 경우에 적합합니다. 예를 들어 사진 또는 비디오를 Blob 스토리지에 업로드하는 클라이언트 애플리케이션은 블록 Blob을 대상으로 합니다.
추가 Blob은 블록으로 구성된다는 점에서 블록 Blob과 유사합니다. 추가 Blob을 수정하면 블록은 Blob의 끝에만 추가됩니다. 추가 Blob은 애플리케이션에서 기존 Blob에 데이터를 추가해야 하는 경우 로깅과 같은 시나리오에 유용합니다.
페이지 Blob은 애플리케이션이 데이터에 대해 임의 쓰기를 수행해야 하는 경우에 적합합니다. 예를 들어 Azure 가상 머신 디스크는 페이지 Blob으로 저장됩니다. 자세한 내용은 블록 Blob, 추가 Blob, 페이지 Blob 이해를 참조하세요.