Políticas de segurança de conteúdo padrão
O Serviço OpenAI do Azure inclui segurança padrão aplicada a todos os modelos, excluindo o Whisper do OpenAI do Azure Essas configurações fornecem uma experiência responsável por padrão, incluindo modelos de filtragem de conteúdo, listas de bloqueio, transformação de prompt, credenciais de conteúdo e outros.
A segurança padrão visa mitigar riscos como ódio e imparcialidade, sexual, violência, automutilação, conteúdo material protegido e ataques de injeção de solicitação de usuário. Para saber mais sobre filtragem de conteúdo, visite nossa documentação que descreve categorias e níveis de gravidade aqui.
Toda a segurança é configurável. Para saber mais sobre a configurabilidade, visite nossa documentação sobre como configurar a filtragem de conteúdo.
Modelos de texto: GPT-4, GPT-3.5
Os modelos de texto no Serviço OpenAI do Azure podem receber e gerar texto e código. Esses modelos aproveitam os modelos de filtragem de conteúdo de texto do Azure para detectar e evitar conteúdo prejudicial. Esse sistema funciona no prompt e na conclusão.
Categoria de Risco | Prompt/Conclusão | Limite de Severidade |
---|---|---|
Ódio e imparcialidade | Prompts e Conclusões | Médio |
Violência | Prompts e Conclusões | Médio |
Sexual | Prompts e Conclusões | Médio |
Automutilação | Prompts e Conclusões | Médio |
Ataque de injeção de prompt do usuário (Jailbreak) | Prompts | N/D |
Material Protegido – Texto | Preenchimentos | N/D |
Material Protegido – Código | Preenchimentos | N/D |
Modelos de visão: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2
GPT-4o e GPT-4 Turbo
Categoria de Risco | Prompt/Conclusão | Limite de Severidade |
---|---|---|
Ódio e imparcialidade | Prompts e Conclusões | Médio |
Violência | Prompts e Conclusões | Médio |
Sexual | Prompts e Conclusões | Médio |
Automutilação | Prompts e Conclusões | Médio |
Identificação de indivíduos e inferência de atributos confidenciais | Prompts | N/D |
Ataque de injeção de prompt do usuário (Jailbreak) | Prompts | N/D |
DALL-E 3 e DALL-E 2
Categoria de Risco | Prompt/Conclusão | Limite de Severidade |
---|---|---|
Ódio e imparcialidade | Prompts e Conclusões | Baixo |
Violência | Prompts e Conclusões | Baixo |
Sexual | Prompts e Conclusões | Baixo |
Automutilação | Prompts e Conclusões | Baixo |
Definir as Credenciais | Preenchimentos | N/D |
Geração Enganosa de Candidatos Políticos | Prompts | N/D |
Representações de Figuras Públicas | Prompts | N/D |
Ataque de injeção de prompt do usuário (Jailbreak) | Prompts | N/D |
Material Protegido – Personagens de Arte e de Estúdio | Prompts | N/D |
Conteúdo ofensivo | Prompts | N/D |
Além das configurações de segurança acima, o DALL-E do OpenAI do Azure também vem com a transformação de prompt por padrão. Essa transformação ocorre em todos os prompts para melhorar a segurança do seu prompt original, especificamente nas categorias de risco de diversidade, geração enganosa de candidatos políticos, representações de figuras públicas, material protegido e outros.