다음을 통해 공유


Azure OpenAI Service 모델

Azure OpenAI 서비스는 다양한 기능과 가격대를 갖춘 다양한 모델 집합으로 구동됩니다. 모델 가용성은 지역 및 클라우드에 따라 다릅니다. Azure Government 모델 가용성은 Azure Government OpenAI Service를 참조하세요.

모델 설명
o1 및 o1-mini 제한된 액세스 모델, 특히 향상된 포커스와 기능으로 추론 및 문제 해결 작업을 해결하도록 설계되었습니다.
GPT-4o 및 GPT-4o mini 및 GPT-4 Turbo 텍스트와 이미지를 모두 입력으로 허용할 수 있는 다중 모달 버전을 갖춘 가장 유능한 최신 Azure OpenAI 모델입니다.
GPT-4o-Realtime-Preview 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원하는 GPT-4o 모델입니다.
GPT-4 GPT-3.5를 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
GPT-3.5 GPT-3을 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
포함 텍스트 유사성을 촉진하기 위해 텍스트를 숫자 벡터 형식으로 변환할 수 있는 모델 집합입니다.
DALL-E 자연어에서 원본 이미지를 생성할 수 있는 일련의 모델입니다.
위스퍼 음성을 텍스트로 기록하고 번역할 수 있는 일련의 미리 보기 모델입니다.
텍스트 음성 변환(미리 보기) 텍스트 음성 변환을 합성할 수 있는 일련의 미리 보기 모델입니다.

o1 및 o1-mini 모델 액세스 제한

Azure OpenAI o1o1-mini 모델은 향상된 집중도와 기능을 통해 추론 및 문제 해결 작업을 처리하도록 특별히 설계되었습니다. 이러한 모델은 사용자의 요청을 처리하고 이해하는 데 더 많은 시간을 할애하여 이전 반복에 비해 과학, 코딩, 수학과 같은 영역에서 매우 강력한 성능을 보입니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
o1 (2024-12-17) 향상된 추론 능력을 제공하는 o1 시리즈에서 가장 유능한 모델입니다.
액세스 요청: 제한된 액세스 모델 애플리케이션
- 구조적 출력
- 텍스트, 이미지 처리
- 함수/도구
입력: 200,000
출력: 100,000
o1-preview (2024-09-12) 이전 미리 보기 버전 입력: 128,000
출력: 32,768
2023년 10월
o1-mini (2024-09-12) o1 시리즈의 더 빠르고 비용 효율적인 옵션으로, 속도와 리소스 사용량이 낮은 코딩 작업에 적합합니다. 입력: 128,000
출력: 65,536
2023년 10월

가용성

이제 API o1 액세스 및 o1-mini 모델 배포에 모델 및 모델을 사용할 수 있습니다. 등록이 필요하며 Microsoft의 자격 기준에 따라 액세스 권한이 부여됩니다. 이전에 액세스 권한을 o1-preview적용하고 받은 고객은 최신 모델의 대기 목록에 자동으로 있으므로 다시 적용할 필요가 없습니다.

액세스 요청: 모델에 대한 제한된 액세스 신청서

액세스 권한이 부여되면 각 모델에 대한 배포를 만들어야 합니다. 현재 업그레이드가 지원되지 않는 기존 o1-preview 배포가 있는 경우 새 배포를 만들어야 합니다.

고급 o1 시리즈 모델에 대한 자세한 내용은 o1 시리즈 추론 모델을 시작하세요.

사용 가능 지역

모델 지역
o1 미국 동부 2(글로벌 표준)
스웨덴 중부(글로벌 표준)
o1-preview 모델 테이블을 참조하세요.
o1-mini 모델 테이블을 참조하세요.

GPT-4o-Realtime-Preview

gpt-4o-realtime-preview 모델은 GPT-4o 모델 제품군의 일부이며 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원합니다. GPT-4o 오디오는 실시간 대기 시간이 짧은 대화형 상호 작용을 처리하도록 설계되어 사용자와의 응답성이 높은 지원 에이전트, 도우미, 번역기 및 기타 사용 사례에 적합합니다.

GPT-4o 오디오는 미국 동부 2() 및 스웨덴 중부(eastus2swedencentral) 지역에서 사용할 수 있습니다. GPT-4o 오디오 를 사용하려면 지원되는 지역 중 하나에서 기존 리소스를 만들 거나 사용해야 합니다.

리소스를 만들 때 GPT-4o 오디오 모델을 배포할 수 있습니다. 프로그래밍 방식 배포 를 수행하는 경우 모델 이름은 .입니다 gpt-4o-realtime-preview. GPT-4o 오디오를 사용하는 방법에 대한 자세한 내용은 GPT-4o 오디오 설명서를 참조 하세요.

최대 요청 토큰 및 학습 데이터에 대한 자세한 내용은 다음 표에서 확인할 수 있습니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
gpt-4o-realtime-preview (2024-10-01-preview)
GPT-4o 오디오
실시간 오디오 처리를 위한 오디오 모델 입력: 128,000
출력: 4,096
2023년 10월

GPT-4o 및 GPT-4 Turbo

GPT-4o는 텍스트와 이미지를 단일 모델에 통합하여 여러 데이터 형식을 동시에 처리할 수 있습니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다. GPT-4o는 영어 텍스트 및 코딩 작업에서 GPT-4 Turbo와 일치하는 동시에 영어가 아닌 언어 및 비전 작업에서 탁월한 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.

GPT-4o 및 GPT-4o mini 모델에 어떻게 액세스할 수 있나요?

GPT-4o 및 GPT-4o mini는 표준글로벌 표준 모델 배포에 사용할 수 있습니다.

모델을 사용할 수 있는 지원 표준 또는 글로벌 표준 지역에서 기존 리소스를 만들거나 사용해야 합니다.

리소스가 만들어지면 GPT-4o 모델을 배포할 수 있습니다. 프로그래밍 방식으로 배포하는 경우 모델 이름은 다음과 같습니다.

  • gpt-4o 버전 2024-11-20
  • gpt-4o 버전 2024-08-06
  • gpt-4o 버전 2024-05-13
  • gpt-4o-mini 버전 2024-07-18

GPT-4 Turbo

GPT-4 Turbo는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있는 큰 멀티모달 모델(텍스트 또는 이미지 입력 허용 및 텍스트 생성)입니다. GPT-3.5 Turbo와 마찬가지로 이전 GPT-4 모델 GPT-4 Turbo는 채팅에 최적화되어 있으며 기존 완료 작업에 적합합니다.

GPT-4 Turbo의 최신 GA 릴리스는 다음과 같습니다.

  • gpt-4 버전: turbo-2024-04-09

이는 다음 미리 보기 모델을 대체합니다.

  • gpt-4 버전: 1106-Preview
  • gpt-4 버전: 0125-Preview
  • gpt-4 버전: vision-preview

OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점

  • OpenAI의 최신 0409 터보 모델 버전은 JSON 모드와 모든 유추 요청에 대한 함수 호출을 지원합니다.
  • Azure OpenAI의 최신 turbo-2024-04-09 버전은 현재 이미지(비전) 입력으로 유추 요청을 할 때 JSON 모드 및 함수 호출 사용을 지원하지 않습니다. 텍스트 기반 입력 요청(image_url 및 인라인 이미지가 없는 요청)은 JSON 모드 및 함수 호출을 지원합니다.

gpt-4 vision-preview와의 차이점

  • GPT-4 Turbo with Vision과 Azure AI 관련 Vision 개선 사항 통합은 gpt-4 버전: turbo-2024-04-09에서는 지원되지 않습니다. 여기에는 OCR(광학 인식), 개체 근거 있는, 동영상 프롬프트 및 이미지가 포함된 데이터 처리 개선이 포함됩니다.

Important

OCR(광학 인식), 개체 그라운딩, 동영상 프롬프트를 포함한 비전 향상 미리 보기 기능은 gpt-4 버전: vision-previewturbo-2024-04-09로 업그레이드되면 더 이상 사용할 수 없습니다. 현재 이러한 미리 보기 기능 중 하나라도 사용하고 있는 경우, 이 자동 모델 업그레이드는 호환성이 손상되는 변경이 됩니다.

GPT-4 Turbo 프로비전된 관리 가용성

  • gpt-4 버전: turbo-2024-04-09은(는) 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 현재 이 모델의 프로비전된 버전은 이미지/비전 유추 요청을 지원하지 않습니다. 이 모델의 프로비전된 배포에서는 텍스트 입력만 허용됩니다. 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다.

GPT-4 Turbo with Vision GA 배포

Azure AI Foundry 포털에서 GA 모델을 배포하려면 드롭다운 메뉴에서 버전을 선택하고 GPT-4 선택합니다 turbo-2024-04-09 . gpt-4-turbo-2024-04-09 모델의 기본 할당량은 GPT-4-Turbo의 현재 할당량과 동일합니다. 지역별 할당량 한도를 참조하세요.

GPT-4

GPT-4는 GPT-4 Turbo의 선행 버전입니다. GPT-4 및 GPT-4 Turbo 모델 모두 기본 모델 이름은 gpt-4입니다. 모델 버전을 검사하여 GPT-4와 Turbo 모델을 구분할 수 있습니다.

  • gpt-4 버전 0314
  • gpt-4 버전 0613
  • gpt-4-32k 버전 0613

모델 요약 표에서 각 모델이 지원하는 토큰 컨텍스트 길이를 확인할 수 있습니다.

GPT-4 및 GPT-4 Turbo 모델

  • 이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-4 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
gpt-4o (2024-11-20)
GPT-4o(Omni)
최신 대규모 GA 모델
- 구조적 출력
- 텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
- 정확도와 반응성 향상
- GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티
- 비영어 및 비전 작업에서 뛰어난 성능.
- 향상된 창의적인 쓰기 능력
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o(2024-08-06)
GPT-4o(Omni)
- 구조적 출력
- 텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
- 정확도와 반응성 향상
- GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티
- 영어 이외의 언어 및 비전 작업에서 뛰어난 성능
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o-mini(2024-07-18)
GPT-4o mini
최신 소규모 GA 모델
- GPT-3.5 Turbo 시리즈 모델을 대체하는 데 이상적인 빠르고 저렴하며 성능이 좋은 모델입니다.
- 텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o(2024-05-13)
GPT-4o(Omni)
텍스트, 이미지 처리
- JSON 모드
- 병렬 함수 호출
- 정확도와 반응성 향상
- GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티
- 영어 이외의 언어 및 비전 작업에서 뛰어난 성능
입력: 128,000
출력: 4,096
2023년 10월
gpt-4(turbo-2024-04-09)
비전 포함 GPT-4 Turbo
새 GA 모델
- 이전의 모든 GPT-4 미리 보기 모델(vision-preview, 1106-Preview, 0125-Preview)을 바꿉니다.
- 기능 제공 여부는 현재 입력 방법 및 배포 유형에 따라 다릅니다.
입력: 128,000
출력: 4,096
2023년 12월
gpt-4(0125-Preview)*
GPT-4 Turbo 미리 보기
미리 보기 모델
- 1106-Preview 대체
- 코드 생성 성능 향상
- 모델이 작업을 완료하지 않는 경우 감소
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 128,000
출력: 4,096
2023년 12월
gpt-4(vision-preview)
GPT-4 Turbo with Vision 미리 보기
미리 보기 모델
- 텍스트 및 이미지 입력 허용
- 강화 지원
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 128,000
출력: 4,096
2023년 4월
gpt-4 (1106-미리 보기)
GPT-4 Turbo 미리 보기
미리 보기 모델
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 128,000
출력: 4,096
2023년 4월
gpt-4-32k(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
32,768 2021년 9월
gpt-4(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
8,192 2021년 9월
gpt-4-32k(0314) 이전 GA 모델
- 사용 중지 정보
32,768 2021년 9월
gpt-4(0314) 이전 GA 모델
- 사용 중지 정보
8,192 2021년 9월

주의

프로덕션 환경에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 또는 안정적인 최신 GA 버전으로 업그레이드합니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

  • GPT-4 버전 0125-preview는 이전에 버전 1106-preview로 릴리스된 GPT-4 Turbo 미리 보기의 업데이트된 버전입니다.
  • GPT-4 버전 0125-preview는 gpt-4-1106-preview에 비해 코드 생성과 같은 작업을 완전히 완료합니다. 이때문에 태스크에 따라 고객은 GPT-4-0125-preview가 gpt-4-1106-preview에 비해 더 많은 출력을 생성한다는 것을 알 수 있습니다. 고객은 새 모델의 출력을 비교하는 것이 좋습니다. GPT-4-0125-preview는 영어가 아닌 언어에 대해 UTF-8 처리를 사용하여 gpt-4-1106-preview의 버그도 해결합니다.
  • GPT-4 버전 turbo-2024-04-09(은)는 최신 GA 릴리스이며 0125-Preview, 1106-previewvision-preview(을)를 대체합니다.

Important

GPT-4(gpt-4) 버전1106-Preview0125-Preview이며vision-preview, 향후 안정적인 버전 gpt-4 으로 업그레이드될 예정입니다.

  • gpt-4 버전 1106-Preview0125-Preview배포 및 vision-preview "기본값으로 자동 업데이트" 및 "만료되면 업그레이드"로 설정하면 안정적인 버전이 릴리스된 후 업그레이드가 시작됩니다. 각 배포에 대해 모델 버전 업그레이드는 API 호출에 대한 서비스 중단 없이 발생합니다. 업그레이드는 지역별로 준비되며 전체 업그레이드 프로세스는 2주가 걸릴 것으로 예상됩니다.
  • gpt-4"자동 업데이트 없음"으로 설정된 버전의 1106-Preview0125-Previewvision-preview 배포는 업그레이드되지 않으며 지역에서 미리 보기 버전이 업그레이드될 때 작동이 중지됩니다. 업그레이드 시기에 대한 자세한 내용은 Azure OpenAI 모델 사용 중지 및 사용 중단을 참조하세요.

GPT-3.5

GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. GPT-3.5 제품군에서 가장 유능하고 비용 효율적인 모델은 GPT-3.5 Turbo로, 이는 채팅에 최적화되었으며 기존 완료 작업에도 잘 작동합니다. GPT-3.5 Turbo는 채팅 완료 API에서 사용할 수 있습니다. GPT-3.5 Turbo Instruct에는 채팅 완료 API 대신 완료 API를 사용하는 text-davinci-003과 유사한 기능이 있습니다. 레거시 GPT-3.5 및 GPT-3 모델보다는 GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 사용하는 것이 좋습니다.

Model ID 설명 최대 요청(토큰) 학습 데이터(최대)
gpt-35-turbo (0125) 신규 최신 GA 모델
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
- 요청된 형식으로 응답할 때 높아지는 정확도
- 영어 이외의 언어 함수 호출에서 텍스트 인코딩 문제를 발생시킨 버그 수정
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo(1106) 이전 GA 모델
- JSON 모드
- 병렬 함수 호출
- 재현 가능한 출력(미리 보기)
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo-instruct(0914) 완성 엔드포인트만
- 레거시 완료 모델 대체
4,097 2021년 9월
gpt-35-turbo-16k(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
16,384 2021년 9월
gpt-35-turbo(0613) 이전 GA 모델
- 도구를 사용하는 기본 함수 호출
4,096 2021년 9월
gpt-35-turbo1(0301) 이전 GA 모델
- 사용 중지 정보
4,096 2021년 9월

GPT-3.5 Turbo 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.

1 이 모델은 4,096개의 > 토큰 요청을 수락합니다. 최신 버전의 모델이 4,096개의 토큰으로 제한되므로 4,096개의 입력 토큰 제한을 초과하지 않는 것이 좋습니다. 이 모델에서 4,096개의 입력 토큰을 초과할 때 문제가 발생하는 경우 이 구성은 공식적으로 지원되지 않습니다.

포함

text-embedding-3-large(은)는 최신의 가장 좋은 기능이 포함된 모델입니다. 포함된 모델 간 업그레이드는 불가능합니다. text-embedding-ada-002 사용에서 text-embedding-3-large(으)로 이동하려면 새 포함을 생성해야 합니다.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

테스트에서 OpenAI는 MTEB 벤치마크를 사용하여 영어 작업에 대한 성능을 유지하면서 MIRACL 벤치마크를 통해 크고 작은 3세대 임베딩 모델이 더 나은 평균 다국어 검색 성능을 제공한다고 보고합니다.

평가 벤치마크 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 평균 31.4 44.0 54.9
MTEB 평균 61.0 62.3 64.6

3세대 포함 모델은 새 dimensions 매개 변수를 통해 포함 크기를 줄일 수 있습니다. 일반적으로 더 큰게 포함되면 컴퓨팅, 메모리 및 스토리지 관점에서 더 비쌉니다. 차원 수를 조정할 수 있게 되므로 전체 비용 및 성능을 더 많이 제어할 수 있습니다. dimensions 매개 변수는 모든 버전의 OpenAI 1.x Python 라이브러리에서 지원되지 않습니다. 이 매개 변수를 활용하려면 최신 버전인 pip install openai --upgrade(으)로 업그레이드하는 것이 좋습니다.

OpenAI의 MTEB 벤치마크 테스트에 따르면 3세대 모델의 차원이 text-embeddings-ada-002 1,536차원 미만으로 감소하더라도 성능은 약간 향상됩니다.

DALL-E

DALL-E 모델은 사용자가 제공하는 텍스트 프롬프트에서 이미지를 생성합니다. DALL-E 3은 일반적으로 REST API와 함께 사용할 수 있습니다. 클라이언트 SDK를 사용하는 DALL-E 2 및 DALL-E 3은 미리 보기로 제공됩니다.

위스퍼

현재 미리 보기 중인 위스퍼 모델은 음성 텍스트 변환에 사용할 수 있습니다.

Azure AI 음성 일괄 처리 대화 기록 API를 통해 Whisper 모델을 사용할 수도 있습니다. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.

텍스트 음성 변환(미리 보기)

현재 미리 보기로 제공되는 OpenAI 텍스트 음성 변환 모델은 텍스트 음성 변환을 합성하는 데 사용할 수 있습니다.

Azure AI Speech를 통해 OpenAI 텍스트 음성 변환 음성을 사용할 수도 있습니다. 자세한 내용은 Azure OpenAI Service 또는 Azure AI 음성을 통한 OpenAI 텍스트 음성 변환 음성 가이드를 참조하세요.

모델 요약 테이블 및 지역 가용성

배포 유형별 모델

Azure OpenAI는 고객에게 비즈니스 및 사용 패턴에 맞는 호스팅 구조를 선택할 수 있는 기회를 제공합니다. 이 서비스는 다음 두 가지 주요 배포 유형을 제공합니다.

  • 표준 은 글로벌 배포 옵션과 함께 제공되며, 트래픽을 전역적으로 라우팅하여 더 높은 처리량을 제공합니다.
  • 또한 프로비전은 글로벌 배포 옵션과 함께 제공되므로 고객은 Azure 글로벌 인프라에서 프로비전된 처리량 단위를 구매하고 배포할 수 있습니다.

모든 배포는 정확히 동일한 유추 작업을 수행할 수 있지만 청구, 규모 및 성능은 크게 다릅니다. Azure OpenAI 배포 유형에 대한 자세한 내용은 배포 유형 가이드를 참조하세요.

글로벌 표준 모델 가용성

지역 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01 gpt-4, turbo-2024-04-09
australiaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
polandcentral - - - -
southafricanorth - - - -
southcentralus -
southindia - - - -
스페인 중부 - - - -
스웨덴 중부
스위스 북부 - - - -
uaenorth - - - -
uksouth - - - -
westeurope - - - -
westus -
westus3 -

이 표에는 지역별 가용성 정보 미세 조정이 포함되어 있지 않습니다. 이 정보는 미세 조정 섹션을 참조하세요.

엔드포인트별 표준 모델

채팅 완성

지역 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-미리 보기 gpt-4, 0125-미리 보기 gpt-4, vision-미리 보기 gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - - - - -
canadaeast - - - - - - - - -
eastus - - - - -
eastus2 - - - - - -
francecentral - - - - - - - - -
japaneast - - - - - - - - - - - -
northcentralus - - - - - -
norwayeast - - - - - - - - - - - - - - -
southcentralus - - - - - - -
southindia - - - - - - - - - - - - -
스웨덴 중부 - - -
스위스 북부 - - - - - - - - - -
uksouth - - - - - - - - -
westeurope - - - - - - - - - - - - - - -
westus - - - - - -
westus3 - - - - - - - -

GPT-4 및 GPT-4 Turbo 모델 가용성

고객 액세스 선택

모든 Azure OpenAI 고객이 사용할 수 있는 위의 지역 외에도 일부 기존 고객은 추가 지역에서 GPT-4 버전에 대한 액세스 권한을 부여했습니다.

모델 지역
gpt-4(0314)
gpt-4-32k(0314)
미국 동부
프랑스 중부
미국 중남부
영국 남부
gpt-4 (0613)
gpt-4-32k(0613)
미국 동부
미국 동부 2
일본 동부
영국 남부

GPT-3.5 모델

모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-3.5 Turbo 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.

모델 미세 조정

참고 항목

gpt-35-turbo - 이 모델의 미세 조정은 하위 지역 집합으로 제한되며 기본 모델을 사용할 수 있는 모든 지역에서는 사용할 수 없습니다.

Azure AI Foundry 프로젝트에서 Azure OpenAI 모델을 사용하는 경우와 프로젝트 외부를 사용하는 경우 미세 조정에 지원되는 지역이 달라질 수 있습니다.

Model ID 미세 조정 지역 최대 요청(토큰) 학습 데이터(최대)
babbage-002 미국 중북부
스웨덴 중부
스위스 서부
16,384 2021년 9월
davinci-002 미국 중북부
스웨덴 중부
스위스 서부
16,384 2021년 9월
gpt-35-turbo(0613) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
4,096 2021년 9월
gpt-35-turbo(1106) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo (0125) 미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
16,385 2021년 9월
gpt-4 (0613) 1 미국 중북부
스웨덴 중부
8192 2021년 9월
gpt-4o-mini(2024-07-18) 미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 64,536
2023년 10월
gpt-4o (2024-08-06) 미국 동부2
미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 64,536
2023년 10월

1 GPT-4는 현재 공개 미리 보기로 제공됩니다.

도우미(미리 보기)

도우미의 경우 지원되는 모델과 지원되는 지역의 조합이 필요합니다. 특정 도구와 기능에는 최신 모델이 필요합니다. 다음 모델은 Assistants API, SDK 및 Azure AI Foundry에서 사용할 수 있습니다. 다음 표는 종량제에 대한 것입니다. 프로비전된 처리량 단위(PTU) 가용성에 대한 자세한 내용은 프로비전된 처리량을 참조하세요. 나열된 모델과 지역은 Assistants v1과 v2 모두에서 사용할 수 있습니다. 아래 나열된 지역에서 지원되는 경우 글로벌 표준 모델을 사용할 수 있습니다.

지역 gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
오스트레일리아 동부
미국 동부
미국 동부 2
프랑스 중부
일본 동부
노르웨이 동부
스웨덴 중부
영국 남부
미국 서부
미국 서부 3

모델 사용 중지

모델 사용 중지에 대한 최신 정보는 모델 사용 중지 가이드를 참조하세요.

다음 단계