Substituições e desativações de modelos do Serviço OpenAI do Azure
Visão geral
Os modelos do Serviço OpenAI do Azure são atualizados continuamente com modelos mais recentes e capazes. Como parte desse processo, substituímos e desativamos modelos mais antigos. Este documento fornece informações sobre os modelos que estão disponíveis, preteridos e desativados no momento.
Terminologia
- Desativação
- Quando um modelo é desativado, ele não fica mais disponível para uso. As implantações do Serviço OpenAI do Azure de um modelo desativado sempre retornam respostas de erro.
- Reprovação
- Quando um modelo é preterido, ele não está mais disponível para novos clientes. Ele continua disponível para uso por clientes com implantações existentes até que o modelo seja desativado.
Notificações
O OpenAI do Azure notifica os clientes sobre as implantações ativas do Serviço OpenAI do Azure para modelos com desativações futuras. Notificaremos os clientes sobre as próximas desativações da seguinte maneira para cada implantação:
- No lançamento do modelo, designamos programaticamente uma data de desativação "não antes de" (normalmente de seis meses a um ano).
- Aviso prévio de pelo menos 60 dias antes da desativação do modelo para modelos de GA (Disponibilidade geral).
- Aviso prévio de 30 dias antes das atualizações da versão do modelo de versão prévia.
As desativações são feitas de forma contínua, região por região.
Modelo de disponibilidade
- Pelo menos um ano da disponibilidade do modelo para modelos de GA após a data de lançamento de um modelo em pelo menos uma região em todo o mundo
- Para implantações globais, todas as versões futuras do modelo que começa com
gpt-4o
egpt-4 0409
estarão disponíveis em seu (N
) próximo modelo de sucesso (N+1
) para comparação em conjunto. - Os clientes têm 60 dias para experimentar um novo modelo de GA em pelo menos uma região global ou padrão, antes que quaisquer atualizações ocorram em um modelo de GA mais recente.
Considerações para a nuvem pública do Azure
Esteja ciente do seguinte:
- Todas as combinações de versão do modelo não estarão disponíveis em todas as regiões.
- A versão do modelo
N
eN+1
pode nem sempre estar disponível na mesma região. - A versão do modelo de GA
N
pode atualizar para uma versão futura do modeloN+X
em algumas regiões com base nas limitações de capacidade e sem que a nova versão do modeloN+X
esteja disponível separadamente para teste na mesma região. A nova versão do modelo estará disponível para teste em outras regiões antes que as atualizações sejam agendadas. - As versões de modelo de versão prévia e as versões de GA do mesmo modelo nem sempre estarão disponíveis para teste em conjunto na mesma região. Haverá versões de versão prévia e de GA disponíveis para teste em regiões diferentes.
- Reservamos-nos o direito de limitar os clientes futuros usando uma região específica para equilibrar a qualidade do serviço para clientes existentes.
- Como sempre na Microsoft, a segurança é de extrema importância. Caso seja constatado que um modelo ou versão de modelo apresenta problemas de conformidade ou segurança, reservamos-nos o direito de invocar a necessidade de fazer desativações emergenciais. Confira os termos de serviço para obter mais informações.
Considerações especiais para nuvens do Azure Governamental
- As implantações padrão globais não estarão disponíveis em nuvens governamentais.
- Nem todos os modelos ou versões de modelo disponíveis na nuvem comercial/pública estarão disponíveis em nuvens governamentais.
- Nas nuvens do Azure Governamental, pretendemos dar suporte apenas a uma versão de um determinado modelo de cada vez.
- Por exemplo, apenas uma versão de
gpt-35-turbo 0125
egpt-4o (2024-05-13)
.
- Por exemplo, apenas uma versão de
- No entanto, haverá uma sobreposição de 30 dias entre as novas versões do modelo, em que mais de duas estarão disponíveis.
- Por exemplo, se
gpt-35-turbo 0125
ougpt-4o (2024-05-13)
for atualizada para uma versão futura ou - para alterações na família de modelos além das atualizações de versão, como ao migrar de
gpt-4 1106-preview
paragpt-4o (2024-05-13)
.
- Por exemplo, se
Quem recebe notificações sobre as próximas desativações
O OpenAI do Azure notifica membros das seguintes funções para cada assinatura com uma implantação de um modelo com desativação futura.
- Proprietário
- Colaborador
- Leitor
- Colaborador de monitoramento
- Leitor de monitoramento
Como se preparar para desativações de modelo e atualizações de versão
Para se preparar para desativações de modelo e atualizações de versão, recomendamos que os clientes testem seus aplicativos com os novos modelos e versões e seu comportamento. Também recomendamos atualizar os aplicativos para uso dos novos modelos e versões antes da data de desativação.
Para obter mais informações sobre o processo de avaliação do modelo, consulte Introdução ao guia de avaliação do modelo.
Para obter informações sobre o processo de atualização do modelo, consulte Como atualizar para um novo modelo ou versão.
Modelos atuais
Observação
Nem todos os modelos passam por um período de depreciação antes da desativação. Alguns modelos/versões têm apenas uma data de desativação.
Os modelos ajustados estão sujeitos ao mesmo cronograma de reprovação e desativação do modelo base equivalente.
Atualmente, estes modelos estão disponíveis para uso no Serviço OpenAI do Azure.
Modelar | Versão | Data de baixa | Substituições sugeridas |
---|---|---|---|
babbage-002 |
1 | Data de desativação: 27 de janeiro de 2025 | |
davinci-002 |
1 | Data de desativação: 27 de janeiro de 2025 | |
dall-e-2 |
2 | 27 de janeiro de 2025 | dalle-3 |
dall-e-3 |
3 | Em ou após 30 de abril de 2025 | |
gpt-35-turbo |
0301 | 13 de fevereiro de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: 0125 , a partir de 13 de janeiro de 2025. |
gpt-35-turbo (0125) gpt-4o-mini |
gpt-35-turbo gpt-35-turbo-16k |
0613 | 13 de fevereiro de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: 0125 , a partir de 13 de janeiro de 2025. |
gpt-35-turbo (0125) gpt-4o-mini |
gpt-35-turbo |
1106 | Em ou após 31 de março de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: 0125 , a partir de 13 de janeiro de 2025. |
gpt-35-turbo (0125) gpt-4o-mini |
gpt-35-turbo |
0125 | Em ou após 31 de março de 2025 | gpt-4o-mini |
gpt-4 gpt-4-32k |
0314 | 6 de junho de 2025 | gpt-4o |
gpt-4 gpt-4-32k |
0613 | 6 de junho de 2025 | gpt-4o |
gpt-4 |
1106-preview | Para ser atualizado para a versão gpt-4 : turbo-2024-04-09 , a partir de 27 de janeiro de 2025 1 |
gpt-4o |
gpt-4 |
0125-preview | Para ser atualizado para a versão gpt-4 : turbo-2024-04-09 , a partir de 27 de janeiro de 2025 1 |
gpt-4o |
gpt-4 |
vision-preview | Para ser atualizado para a versão gpt-4 : turbo-2024-04-09 , a partir de 27 de janeiro de 2025 1 |
gpt-4o |
gpt-4o |
2024-05-13 | Não antes de 20 de maio de 2025 As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: 2024-08-06 , a partir de 13 de fevereiro de 2025. |
|
gpt-4o-mini |
2024-07-18 | Em ou após 18 de julho de 2025 | |
gpt-3.5-turbo-instruct |
0914 | Em ou após 1 de fevereiro de 2025 | |
text-embedding-ada-002 |
2 | Não antes de 3 de outubro de 2025 | text-embedding-3-small ou text-embedding-3-large |
text-embedding-ada-002 |
1 | Não antes de 3 de outubro de 2025 | text-embedding-3-small ou text-embedding-3-large |
text-embedding-3-small |
Não antes de 3 de outubro de 2025 | ||
text-embedding-3-large |
Não antes de 3 de outubro de 2025 |
1 Notificaremos todos os clientes com essas implantações de visualização pelo menos 30 dias antes do início das atualizações. Publicaremos um agendamento de atualização detalhando a ordem das regiões e versões de modelo que seguiremos durante as atualizações e vincularemos a esse agendamento a partir daqui.
Importante
Os recursos de visualização de melhorias de visão, incluindo Reconhecimento Óptico de Caracteres (OCR), fixação de objetos e prompts de vídeo, serão desativados e não estarão mais disponíveis assim que a gpt-4
Versão: vision-preview
for atualizada para turbo-2024-04-09
. Se você estiver dependendo de algum desses recursos de visualização, essa atualização automática do modelo será uma mudança radical.
Versões do modelo padrão
Modelar | Versão padrão atual | Nova versão padrão | Data de atualização padrão |
---|---|---|---|
gpt-35-turbo |
0301 | 0125 | As implantações das versões 0301 , 0613 e 1106 definidas como Atualização automática para padrão serão atualizadas automaticamente para a versão: 0125 , a partir de 13 de janeiro de 2025. |
gpt-4o |
2024-05-13 | 06/08/2024 | As implantações configuradas para Atualização automática para padrão serão automaticamente atualizadas para a versão: 2024-08-06 , a partir de 13 de fevereiro de 2025. |
Modelos preteridos
Estes modelos foram preteridos em 6 de julho de 2023 e foram desativados em 14 de junho de 2024. Esses modelos não estão mais disponíveis para novas implantações. As implantações criadas antes de 6 de julho de 2023 permanecerão disponíveis para os clientes até 14 de junho de 2024. Recomendamos que os clientes migrem seus aplicativos para implantações de modelos de substituição antes da desativação em 14 de junho de 2024.
Se você for um cliente existente procurando informações sobre esses modelos, consulte Modelos herdados.
Modelar | Data de preterição | Data de baixa | Substituição sugerida |
---|---|---|---|
ada | 6 de julho de 2023 | 14 de junho de 2024 | babbage-002 |
babbage | 6 de julho de 2023 | 14 de junho de 2024 | babbage-002 |
curie | 6 de julho de 2023 | 14 de junho de 2024 | davinci-002 |
davinci | 6 de julho de 2023 | 14 de junho de 2024 | davinci-002 |
text-ada-001 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
text-babbage-001 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
text-curie-001 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
text-davinci-002 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
text-davinci-003 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
code-cushman-001 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
code-davinci-002 | 6 de julho de 2023 | 14 de junho de 2024 | gpt-35-turbo-instruct |
text-similarity-ada-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-similarity-babbage-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-similarity-curie-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-similarity-davinci-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-ada-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-ada-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-babbage-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-babbage-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-curie-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-curie-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-davinci-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
text-search-davinci-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
code-search-ada-code-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
code-search-ada-text-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
code-search-babbage-code-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
code-search-babbage-text-001 | 6 de julho de 2023 | 14 de junho de 2024 | text-embedding-3-small |
Histórico de desativação e substituição
11 de dezembro de 2024
Modelos de inserção atualizados para nenhum anterior a 3 de outubro de 2025.
2 de dezembro de 2024
gpt-3.5-turbo-instruct
atualizado para não antes de 1º de fevereiro de 2025.
22 de novembro de 2024
A data de desativação do gpt-35-turbo
1106 foi atualizada para não ser anterior a 31 de março de 2025.
11 de novembro de 2024
Atualizações para:
babbage-002
,davinci-002
.- Data de atualização de versão do modelo PADRÃO
gpt-35-turbo
. gpt-35-turbo
Data de desativação 0301, 0613.gpt-35-turbo
Data de desativação 0125.- Data de atualização do modelo PADRÃO
gpt-4o
. - Data de desativação
text-embeddings-3-small
etext-embedding-3-large
.
25 de outubro de 2024
- Data de substituição de
babbage-002
&davinci-002
: 15 de novembro de 2024 e data de desativação: 27 de janeiro de 2025.
12 de setembro de 2024
- Data de atualização automática de
gpt-35-turbo
(0301), (0613), (1106) egpt-35-turbo-16k
(0613) para o padrão atualizada para 13 de novembro de 2024.
9 de setembro de 2024
- A desativação de
gpt-35-turbo
(0301) e (0613) foi alterada para 27 de janeiro de 2025. - A data de atualização do modelo de visualização
gpt-4
foi alterada para começar antes de 27 de janeiro de 2025.
3 de setembro de 2024
- Tabelas atualizadas para incluir informações sobre atualizações da versão padrão
gpt-35-turbo
. As implantações das versões0301
,0613
e1106
definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão:0125
, a partir de 15 de novembro de 2024.|.
22 de agosto de 2024
- Data de desativação (0301) do
gpt-35-turbo
atualizada para data não anterior a 1º de novembro de 2024. - Atualização de
gpt4
egpt-4-32k
(0314 e 0613) com data de substituição até 1º de novembro de 2024.
8 de agosto de 2024
- Atualizada a data de desativação dos modelos
gpt-35-turbo
egpt-35-turbo-16k
(0613) para 1º de novembro de 2024.
30 de julho de 2024
- A data de atualização da versão prévia do modelo
gpt-4
foi atualizada para 15 de novembro de 2024 ou posterior para as seguintes versões:- 1106-preview
- 0125-preview
- vision-preview (O recurso de melhorias de visão não será mais compatível após a desativação/atualização deste modelo.)
18 de julho de 2024
- Data de substituição do
gpt-4
0613 atualizada para 1º de outubro de 2024 e data de desativação para 6 de junho de 2025.
19 de junho de 2024
- Data de desativação 0301 do
gpt-35-turbo
atualizada para data não anterior a 1º de outubro de 2024. - Data de desativação do
gpt-35-turbo
egpt-35-turbo-16k
0613 atualizada para 1º de outubro de 2024. - Data de substituição do
gpt-4
egpt-4-32k
0314 atualizada para 1º de outubro de 2024 e data de desativação para 6 de junho de 2025.
4 de junho de 2024
Data de desativação dos modelos herdados atualizados por um mês.
24 de abril de 2024
A data de desativação mais antiga do gpt-35-turbo
0301 e 0613 foi atualizada para 1º de agosto de 2024.
13 de março de 2024
Publicamos este documento para fornecer informações sobre os modelos atuais e preteridos e as desativações futuras.
23 de fevereiro de 2024
Anunciamos a próxima atualização in-loco da versão do gpt-4
1106-preview
para 0125-preview
para ter início em ou após 8 de março de 2024.
30 de novembro de 2023
A versão padrão de gpt-4
e gpt-3-32k
foi atualizada de 0314
para 0613
em 30 de novembro de 2023. A atualização das implantações de 0314
definidas para atualização automática para 0613
foi concluída em 3 de dezembro de 2023.
6 de julho de 2023
Anunciamos a substituição de modelos com desativação futura em 5 de julho de 2024.