다음을 통해 공유


Microsoft Azure OpenAI Service 프로비전 예약을 통해 비용 절감

1개월 또는 1년 동안 프로비전된 CPU(처리량 단위) 사용량에 대한 예약을 커밋하여 Azure OpenAI Service 프로비전된 처리량에 대한 비용을 절감할 수 있습니다. 이 문서에서는 Azure OpenAI Service 프로비전 예약을 사용하여 비용을 절감할 수 있는 방법을 설명합니다. Azure OpenAI 서비스PTU에 대한 자세한 내용은 프로비전된 처리량 단위 온보딩을 참조 하세요.

Azure OpenAI 서비스 예약을 구매하려면 Azure 지역, 수량 및 적용하려는 배포 유형을 선택합니다. 그런 다음, Azure OpenAI 서비스 SKU(전역, 데이터 영역 또는 지역)를 카트에 추가합니다. 그런 다음 구매하려는 프로비전된 처리량 단위의 수량을 확인하고 주문을 완료합니다.

예약을 구매하면 예약 특성과 일치하는 Azure OpenAI Service 프로비전된 처리량 사용량이 더 이상 시간당 요금으로 청구되지 않습니다.

참고 항목

전역, 데이터 영역 및 지역 배포에 대한 예약은 서로 교환할 수 없습니다. 각 배포 유형에 대해 별도의 예약을 구매해야 합니다. 프로비전된 배포 전환에 대한 자세한 내용은 Azure OpenAI Service 프로비전 배포 전환을 참조 하세요.

예약 애플리케이션

예약은 프로비전된 배포에만 적용되며 표준 배포나 미세 조정과 같은 다른 제공 사항은 포함되지 않습니다. Azure OpenAI Service 프로비전 예약도 용량 가용성을 보장하지 않습니다. 용량 가용성을 보장하려면 예약을 구매하기 전에 배포를 만드는 것이 가장 좋습니다.

예약이 만료되면 Azure OpenAI 서비스 배포는 계속 실행되지만 시간당 요금이 청구됩니다.

갱신 옵션

갱신 설정에서 옵션을 선택하거나 구매 시 예약을 자동으로 갱신하도록 선택할 수 있습니다. Azure OpenAI 서비스 예약 자동 갱신을 사용하면 예약이 동일한 예약 주문 ID를 사용하여 갱신되고 새 예약은 구매되지 않습니다. 갱신 설정에서 이 예약을 새로운 예약 구매로 바꾸도록 선택할 수도 있으며, 예약이 만료되면 대체 예약이 구매됩니다. 기본적으로 대체 예약은 만료되는 예약과 동일한 특성을 갖습니다. 갱신 설정에서 선택적으로 이름, 대금 청구 주기, 기간 또는 수량을 변경할 수 있습니다. 청구에 사용된 구독 및 예약에 대한 소유자 액세스 권한이 있는 모든 사용자는 갱신을 설정할 수 있습니다.

필수 조건

Azure Portal에서 Azure OpenAI 서비스 예약을 구입할 수 있습니다. 예약 요금은 사전 결제 또는 월별 결제로 처리할 수 있습니다. 예약을 구입하려면 다음을 수행합니다.

  • Azure 구독에는 소유자 역할 또는 예약 구매자 역할이 있어야 합니다.
  • 엔터프라이즈 구독의 경우 Azure Portal에서 예약 인스턴스 정책 옵션을 사용하도록 설정해야 합니다. 설정이 사용하지 않도록 설정된 경우 사용하도록 설정하려면 EA 관리자 권한이 있어야 합니다.
  • Direct Enterprise 고객은 Azure Portal에서 예약 인스턴스 정책 설정을 업데이트할 수 있습니다. 정책 메뉴로 이동하여 설정을 변경합니다.
  • CSP(클라우드 솔루션 공급자) 프로그램의 경우 관리자 담당자나 영업 담당자만 Azure OpenAI Service 프로비전 예약을 구매할 수 있습니다.

예약 구매에 대해 엔터프라이즈 고객과 종량제 고객에게 요금이 청구되는 방법에 대한 자세한 내용은 엔터프라이즈 등록에서 Azure 예약 사용량 이해종량제 구독에서 Azure 예약 사용량 이해를 참조하세요.

구매하기 전에 적절한 크기 및 배포 유형 선택

Azure OpenAI 서비스 예약 크기는 배포를 통해 사용하는 프로비전된 총 처리량 단위를 기반으로 해야 합니다. 예약 구매는 제공된 처리량 단위 단위로 이루어집니다.

예를 들어 프로비전된 지역 배포 유형의 100개 단위와 프로비전된 전역 배포 유형의 50개 단위를 배포했다고 가정합니다. 이 예제에서는 배포된 모든 CPU를 포함하려면 프로비전된 관리 지역 예약을 100단원으로, 프로비전된 관리되는 전역 예약을 50단원으로 구매해야 합니다.

주의

모델 배포에 필요한 용량 가용성은 동적이며 지역과 모델에 따라 자주 변경됩니다. 사용할 수 있는 PTU보다 많은 PTU 예약을 구매하는 것을 방지하려면 먼저 배포를 만듭니다. 그런 다음 배치한 PTU를 충당하기 위한 예약을 구매합니다. 이 모범 사례는 예약 할인을 최대화하고 완전히 사용할 수 없는 기간 약정을 구매하는 것을 방지하는 데 도움이 됩니다.

Microsoft Azure OpenAI 서비스 예약 구입

예약을 구입하면 현재 UTC 날짜 및 시간이 트랜잭션을 기록하는 데 사용됩니다.

Azure OpenAI 서비스 예약을 구입하려면 다음 단계를 수행합니다.

  1. Azure Portal에 로그인합니다.
  2. 모든 서비스 예약을> 선택한 다음, 프로비전된 Azure OpenAI 서비스를 선택합니다.
    구매 예약 페이지를 보여 주는 스크린샷.
  3. 구독을 선택합니다. 구독 목록을 사용하여 예약 비용을 지불하는 데 사용할 구독을 선택합니다. 구독의 결제 방법으로 예약 요금이 청구됩니다. 구독 유형은 기업계약(제안 번호: MS-AZR-0017P 또는 MS-AZR-0148P), Microsoft 고객 계약 또는 종량제(제품 번호: MS-AZR-0003P 또는 MS-AZR-0023P)여야 합니다.
    • 엔터프라이즈 구독의 경우 요금은 등록의 Azure 선불(이전에는 현금 약정 금액이라고 함) 잔액에서 차감되거나 초과분에 대해 청구됩니다.
    • 종량제 구독의 경우 요금은 구독의 신용 카드 또는 송장 결제 방법으로 청구됩니다.
  4. 범위를 선택합니다. 구독 범위를 선택하려면 범위를 사용합니다. 구매 후 예약 범위를 변경할 수 있습니다.
    • 단일 리소스 그룹 범위 - 선택한 리소스 그룹의 일치하는 리소스에만 예약 할인을 적용합니다.
    • 단일 구독 범위 - 선택한 구독의 일치하는 리소스에만 예약 할인을 적용합니다.
    • 공유 범위 - 청구 컨텍스트에 있는 적격 구독의 일치하는 리소스에 예약 할인을 적용합니다. 구독이 다른 청구 컨텍스트로 이동되면 혜택이 더 이상 구독에 적용되지 않습니다. 청구 컨텍스트의 다른 구독에는 계속 적용됩니다.
      • 기업 계약의 경우 청구 컨텍스트는 EA 등록입니다. 예약 공유 범위에는 등록의 여러 Microsoft Entra 테넌트가 포함됩니다.
      • Microsoft 고객 계약 고객의 경우 청구 범위는 청구 프로필입니다.
      • 종량제 고객의 공유 범위는 계정 관리자가 생성한 모든 종량제 구독입니다.
    • 관리 그룹 - 관리 그룹 및 청구 범위의 일부인 구독 목록에서 일치하는 리소스에 예약 할인을 적용합니다. 관리 그룹 범위는 전체 관리 그룹 계층 구조의 모든 구독에 적용됩니다. 관리 그룹에 대한 예약을 구입하려면 관리 그룹에 대한 읽기 권한이 있어야 하며 청구 구독에 대한 예약 소유자 또는 예약 구매자여야 합니다.
  5. 예약에서 적용되는 Azure 지역을 선택할 지역을 선택합니다.
  6. 배포 유형(전역, 데이터 영역 또는 지역)을 다룰 제품을 선택하고 카트에 추가를 선택합니다.
    구매할 제품 선택 페이지를 보여 주는 스크린샷.
  7. 카트에서 구매하려는 프로비전된 처리량 단위의 수량을 선택합니다. 예를 들어 64의 수량은 매시간 배포된 프로비전된 처리량 단위를 최대 64개까지 커버합니다.
  8. 다음: 검토 + 구매를 선택하고 구매 선택 사항과 가격을 검토합니다.
  9. 지금 구매를 선택합니다.
  10. 구매 후 이 예약 보기를 선택하여 구매 상태를 확인할 수 있습니다.

예약 취소, 교환 또는 환불

Exchange는 Azure OpenAI Service 프로비저닝된 예약이 지원되지 않습니다.

특정 제한 사항 하에 예약을 취소하거나 환불할 수 있습니다. 자세한 내용은 Azure Reservations의 셀프 서비스 교환 및 환불을 참조하세요.

Azure OpenAI 서비스 예약에 대한 환불을 요청하려면 다음 단계를 수행하여 환불을 요청할 수 있습니다.

  1. Azure Portal에 로그인하고 예약 페이지로 이동합니다.
  2. 환불하려는 Azure OpenAI 서비스 예약을 선택하고 반환을 선택합니다.
  3. 환불 예약 페이지에서 환불 금액을 검토하고 반환 사유를 선택합니다.
  4. 예약 인스턴스 반환을 선택합니다.
  5. 사용 약관을 검토하고 이에 동의합니다.

환불 금액은 비례 배분된 남은 기간과 예약의 현재 가격을 기준으로 합니다. 환불 금액은 Azure 계정에 크레딧으로 적용됩니다.

환불을 요청하면 예약이 취소되고 Azure Portal의 예약 페이지에서 환불 요청 상태를 볼 수 있습니다.

청구 범위(예: EA, Microsoft 고객 계약, Microsoft 파트너 계약)에서 취소된 모든 예약 약정의 총액은 12개월 연속 기간 동안 USD 50,000을 초과할 수 없습니다.

Azure OpenAI 서비스에 예약 할인이 적용되는 방식

Azure OpenAI 서비스에 대한 예약을 구매한 후 예약 범위에 속하는 한 예약과 관련된 할인이 지정된 지역에 배포된 모든 단위에 자동으로 적용됩니다. 예약 할인은 프로비전된 처리량 종량제 미터에서 방출되는 사용량에 적용됩니다.

참고 항목

전역, 데이터 영역 및 지역 배포에 대한 예약은 서로 교환할 수 없습니다. 각 배포 유형에 대해 별도의 예약을 구매해야 합니다.

예약 할인 애플리케이션

Azure OpenAI 서비스 예약의 애플리케이션은 예약 및 배포된 CPU 간의 시간별 비교를 기반으로 합니다. 배치된 PTU 중 예약된 금액까지의 합계는 예약을 통해 충당(지불)되는 반면, 예약된 PTU를 초과하는 배치된 PTU는 시간당 종량제 요금으로 청구됩니다. 명심해야 할 몇 가지 사항이 더 있습니다.

  • 부분 시간 배포에 대한 PTU는 배포가 해당 시간 동안 존재한 분 수를 기준으로 비례적으로 조정됩니다. 예를 들어, 1시간 동안 15분만 지속되는 100 PTU 배포는 25 PTU 배포로 간주됩니다. 구체적으로 15분은 1/4시간이므로, 해당 시간 동안 배치된 PTU의 1/4만 청구 및 예약 애플리케이션에 고려됩니다.
  • 예약이 적용되기 전에 예약 범위를 기준으로 배포가 예약과 일치됩니다. 예를 들어, 단일 구독으로 범위가 지정된 예약은 해당 구독 내의 배포에만 적용됩니다. 다른 구독의 배포는 범위 내의 다른 예약이 적용되지 않는 한 시간당 종량제 요금으로 청구됩니다.

예약 가격은 예약된 PTU를 연중무휴(24x7)로 배포하는 것을 가정합니다. 배치된 PTU가 예약된 PTU보다 적은 기간에는 배치된 PTU 모두가 예약으로 처리되지만, 초과된 예약된 PTU는 사용되지 않습니다. 이러한 초과 예약된 PTU는 손실되며 다른 기간으로 이월되지 않습니다.

할인 예제

다음 예제에서는 배포에 따라 Azure OpenAI 서비스 예약 할인이 적용되는 방법을 보여 줍니다.

예제 1 - 지역 배포 단위와 정확히 동일한 크기의 지역 예약입니다. 예를 들어 지역 예약에서 100PTU를 구매하고 100개의 지역별PTU를 배포합니다. 이 예제에서는 예약 가격만 지불합니다.

예제 2 - 전역 배포 단위보다 큰 전역 예약입니다. 예를 들어 전역 예약에서 300PTU를 구매하고 100개의 전역PTU만 배포합니다. 이 예제에서는 전역 예약 할인이 100개의 글로벌 CPU에 적용됩니다. 글로벌 예약의 나머지 200PTU는 사용되지 않으며 향후 청구 기간으로 진행되지 않습니다.

예제 3 - 데이터 영역 배포 단위보다 작은 데이터 영역 예약입니다. 예를 들어 데이터 영역 예약에서 200PTU를 구매하고 600개의 데이터 영역PTU를 배포합니다. 이 예제에서는 데이터 영역 예약 할인이 사용된 200개의 데이터 영역PTU에 적용됩니다. 나머지 400개의 데이터 영역 CPU는 종량제 요금으로 청구됩니다.

예제 4 - 두 지역 배포의 총 크기와 동일한 지역 예약입니다. 예를 들어 예약에서 200개의 지역별 CPU를 구매하고 각각 100개의 지역별PTU를 두 개 배포합니다. 이 예에서 할인은 배치된 단위의 합계에 적용됩니다.

Azure OpenAI 서비스 예약 용량 늘리기

구매한 예약의 크기는 변경할 수 없습니다. 매시간 더 많은 CPU를 처리하도록 Azure OpenAI 서비스 예약 용량을 늘리려면 더 많은 Azure OpenAI 서비스 프로비저닝된 예약을 구입할 수 있습니다.

월별 분할 상환 비용

분할 상환 예약 비용은 각 월을 기준으로 합니다. 따라서 연중 각 달에 따라 일일 분할 상환 비용이 변경될 수 있습니다. 월별 분할 상환 비용이 어떻게 다를 수 있는지 설명하는 예제는 다음과 같습니다.

예제 1 - 1월 10일 예약을 구입하는 경우 갱신은 다음과 같습니다.

  • 1개월: 1월 10일~2월 9일(포함)
  • 2개월: 2월 10일 ~ 3월 9일(포함) 등

예제 2 - 12 월 29일, 30일 또는 31일에 예약을 구매하면 갱신 날짜가 1년 동안 변경됩니다. 예를 들어 12월 30일에 예약을 구입한다고 가정합니다.

  • 1개월: 12월 30일~1월 29일(포함)
  • 2개월: 1월 30일 ~ 2월 27일(포함) - 윤년 이외의 연도
  • 3개월: 2월 28일 ~3월 27일(포함) 등

월별 예약에 대한 비용이 $200인 경우 다음을 수행합니다.

  • 예약은 5 월에 구입 한 다음 매일 $200/31의 분할 상환 비용이 표시됩니다.
  • 예약은 2 월에 구입, 당신은 $ 200/28의 일일 분할 상환 비용을 볼 수 있습니다.