Azure OpenAI Service 프로비전된 배포 예약으로 전환
Azure는 Azure OpenAI Service에 대한 새로운 글로벌 및 데이터 영역 프로비전 배포 예약을 도입했습니다. 이러한 새로운 옵션은 더 많은 유연성과 확장성을 제공하므로 필요한 모델에 액세스하고 CPU(프로비전된 처리량 단위)를 확장하여 사용 증가를 지원할 수 있습니다. 또한 Microsoft는 매월 및 연간 예약에 대한 가격은 변경되지 않지만 새 배포 유형에 대해 더 낮은 시간당 가격과 더 작은 배포 최소값을 발표했습니다.
이러한 변경으로 Azure는 진화하는 요구 사항을 더 잘 충족할 수 있길 기대합니다. 현재 지역 프로비저닝된 배포를 사용하는 경우 전역 또는 데이터 영역 프로비저닝된 배포로 전환하면 상당한 이점을 얻을 수 있습니다. 이 가이드는 애플리케이션 및 배포를 마이그레이션하는 방법 및 배포를 포함하는 기존 예약을 전환하는 방법을 포함하여 전환 프로세스를 이해하는 데 도움이 됩니다.
Azure OpenAI Service 프로비전된 배포에 대한 변경 내용
- 2024년 9월, Azure는 전역 프로비전된 배포 예약을 시작했습니다.
- 2024년 12월, Azure는 Data Zone 프로비전된 배포 예약을 시작했습니다.
- 대부분의 고객이 현재 지역 프로비전 배포에 있지만 전역 및 데이터 영역 프로비저닝된 배포는 원하는 경우 요구 사항에 더 적합할 수 있습니다.
- 필요한 모델에 액세스합니다.
- CPU 크기를 조정하여 사용 증가를 지원합니다.
- 전역 및 데이터 영역 프로비저닝된 배포의 경우 Microsoft 는 더 낮은 시간당 가격과 더 작은 배포 최소값을 발표했습니다. 해당 공지 사항으로 월별 및 연간 예약의 가격은 변경되지 않습니다.
- 전역 및 데이터 영역 프로비저닝된 배포가 시작되면서 Azure는 이제 진화하는 요구 사항을 더 잘 충족하는 서비스를 제공합니다.
국가별 배포에서 전역 또는 데이터 영역 프로비저닝된 배포로 전환
지역 프로비저닝된 배포에서 전역 또는 데이터 영역 배포로 이동하려면 서비스 쪽에서 애플리케이션 또는 배포를 마이그레이션해야 합니다. 또한 해당 배포를 포함하는 예약(있는 경우)을 전환해야 합니다.
Azure OpenAI 서비스 배포를 지역 또는 글로벌 또는 데이터 영역으로 전환
기존 Azure OpenAI 서비스 지역 프로비저닝된 배포를 사용하는 경우 데이터 영역 또는 전역 프로비저닝된 배포 유형으로 전환하는 두 가지 옵션이 있습니다.
옵션 1 - 가동 중지 시간 없음
- 원하는 Azure OpenAI Service 리소스에서 Azure OpenAI Service Global Provisioned 또는 Data Zone Provisioned 배포 유형을 사용하여 새 배포를 만듭니다.
- 지역 프로비저닝된 배포에서 모든 트래픽이 오프로드될 때까지 기존 Azure OpenAI 서비스 지역 프로비저닝된 배포에서 새로 만든 Azure OpenAI Service Global 또는 Data Zone 프로비저닝된 배포로 트래픽을 전환합니다.
- 기존 지역 프로비저닝된 배포를 삭제합니다.
옵션 2 – 가동 중지 시간
- Azure OpenAI 서비스 지역 프로비저닝된 배포에서 모든 Azure OpenAI 서비스 API 요청이 중지되었는지 확인합니다.
- 기존 지역 프로비저닝된 배포를 삭제합니다.
- 원하는 Azure OpenAI Service 리소스에서 Azure OpenAI Service Global Provisioned 또는 Data Zone Provisioned 배포 유형을 사용하여 새 배포를 만듭니다.
Azure OpenAI Service 프로비저닝된 예약을 지역 또는 글로벌 또는 데이터 영역으로 전환
- 먼저 프로비전된 지역 배포에 유지할 PTU 수를 결정해야 합니다. 그런 다음 프로비전된 전역 또는 데이터 영역 배포로 이동할 PTU 수를 결정합니다.
- 이러한 배포 중 할인된 가격을 얻기 위해 예약에서 적용해야 하는 수를 결정해야 합니다.
- 전역, 데이터 영역 및 지역 배포에 대한 예약은 변경할 수 없습니다. 각 배포 유형에 대해 별도의 예약을 구매해야 합니다.
- 기존 지역 프로비전된 배포가 있고 전역 또는 데이터 영역 프로비전된 배포로 전환하려는 경우 애플리케이션을 마이그레이션하기 위해 두 유형의 배포가 잠시 동안 존재해야 할 수 있습니다. 이로 인해 지역 프로비전된 배포의 크기를 조정합니다.
- 원하는 최종 상태(지역, 데이터 영역 및 전역 배포)에 따라 기존 예약을 취소하고 배포를 포함하는 새 예약을 구매해야 합니다.
- 다음 두 가지 시나리오 중 하나가 발생할 수 있습니다.
- 기존 예약과 새로 구매한 예약이 겹치면 두 예약 모두에 대한 요금이 청구됩니다.
- 기존 예약 취소와 새 예약 구매 사이의 기간으로 인해 배포에 시간당 요금이 청구됩니다(해당 배포를 포함하는 예약이 없기 때문에 예약 가격 대신).
- 두 경우 모두 이중 청구로 간주되지 않지만 한 배포에서 다른 배포로 전환하는 데 필수적입니다.
- 배포 전환 및 예약 전환에 대한 신중한 계획으로 요금이 최소화됩니다.
- 배포를 전환할 때 예약 관리자가 원하는 종료 상태를 이해해야 합니다. 그런 다음, 각 배포 유형에 대해 적절한 수의 예약 단위를 취소하고 구매할 수 있습니다.
- 모든 배포에 일치하는 예약이 있는지 확인하여 배포에 대한 시간별 요금을 방지합니다.
- 아직 활성화되지 않은 배포에 대한 요금을 방지하려면 예약을 미리 구매하지 마세요.
- 배포를 포함하지 않는 예약을 취소합니다.
- 기존 프로비전된 지역 예약 취소는 기존 예약을 대체하거나 교환하기 위해 새 글로벌 또는 데이터 영역 예약을 구매할 때 승인됩니다.
참고 항목
취소는 제한된 시간 동안 지원됩니다. 전역 또는 데이터 영역 예약으로 전환하려면 프로비전된 지역 예약에 대한 자동 갱신을 중지해야 합니다.
시나리오 1 - 연간 예약
전역 또는 데이터 영역으로 전환하려는 CPU 수에 대한 기존 프로비전된 지역 예약을 취소합니다.
전환하려는 배포를 다루려면 해당 글로벌 또는 데이터 영역 예약을 구매합니다.
예를 들어 지역 배포에 300PTU가 있다고 가정합니다. 200PTU를 데이터 영역 배포로 전환하고 나머지 100개는 지역 배포에 유지하기로 결정합니다. 또한 기존 지역 배포 300개를 모두 포함할 예약이 하나 이상 있다고 가정합니다.
- 예약을 통합하고 다시 정렬하려면 300PTU에 대한 기존 예약을 취소해야 합니다.
- 200개의 데이터 영역 배포를 포함하려면 데이터 영역 예약을 구매합니다.
- 지역별 예약을 구입하여 100개의 지역 배포를 다룹니다.
오류 또는 크레딧 기한이 있다고 생각되면 지원 요청을 만들 수 있습니다.
시나리오 2 - 월별 예약
이 시나리오에서는 두 가지 옵션이 있습니다.
옵션 1 - 단일 월별 예약에 권장됨
현재 월별 예약이 자체 만료되도록 합니다. 예를 들어 기존 예약의 자동 갱신을 중지합니다.
예약을 통합하고 다시 정렬하려면 해당 글로벌, 데이터 영역 또는 지역 예약을 구매합니다. 전환하려는 배포를 다룹니다.
예를 들어 지역 배포에 300PTU가 있다고 가정합니다. 200PTU를 데이터 영역 배포로 전환하고 나머지 100개는 지역 배포에 유지하기로 결정합니다. 또한 300개의 기존 지역 배포를 모두 포함하는 단일 예약이 있다고 가정합니다.
- 예약을 다시 정렬하려면 300PTU를 포함하는 기존 예약의 자동 갱신을 중지해야 합니다.
- 예약이 만료되는 같은 날 또는 다음 날에 데이터 영역 예약을 구입하여 200개의 데이터 영역 배포를 다룹니다. 지역별 예약을 구입하여 100개의 지역 배포를 다룹니다.
- 새 구매 타이밍을 올바르게 지정하면 예약이 겹치거나 시간당 종량제 요금으로 청구되는 것을 방지할 수 있습니다.
오류 또는 크레딧 기한이 있다고 생각되면 지원 요청을 만들 수 있습니다.
옵션 2 - 여러 월별 예약에 권장
- 시나리오 1 - 연간 예약의 단계를 따릅니다.
중요 정보
Warning
현재 PTU 예약을 취소하지만 새 전역 또는 데이터 영역 PTU 예약을 구입하지 않으면 모든 PTU 배포에 시간당 요금이 청구됩니다.
금액이 $50,000보다 작거나 같은 경우 직접 예약을 취소할 수 있습니다. 그렇지 않으면 취소를 요청하려면 Azure 지원 문의해야 합니다. 취소에 대한 지원에 문의하려면 지원 요청 만들기를 참조하세요.
취소는 제한된 시간 동안 지원됩니다. 전역 또는 데이터 영역 예약으로 전환하려면 프로비전된 지역 예약에 대한 자동 갱신을 중지해야 합니다.