Compartilhar via


Políticas de segurança de conteúdo padrão

O Serviço OpenAI do Azure inclui segurança padrão aplicada a todos os modelos, excluindo o Whisper do OpenAI do Azure Essas configurações fornecem uma experiência responsável por padrão, incluindo modelos de filtragem de conteúdo, listas de bloqueio, transformação de prompt, credenciais de conteúdo e outros.

A segurança padrão visa mitigar riscos como ódio e imparcialidade, sexual, violência, automutilação, conteúdo material protegido e ataques de injeção de solicitação de usuário. Para saber mais sobre filtragem de conteúdo, visite nossa documentação que descreve categorias e níveis de gravidade aqui.

Toda a segurança é configurável. Para saber mais sobre a configurabilidade, visite nossa documentação sobre como configurar a filtragem de conteúdo.

Modelos de texto: GPT-4, GPT-3.5

Os modelos de texto no Serviço OpenAI do Azure podem receber e gerar texto e código. Esses modelos aproveitam os modelos de filtragem de conteúdo de texto do Azure para detectar e evitar conteúdo prejudicial. Esse sistema funciona no prompt e na conclusão.

Categoria de Risco Prompt/Conclusão Limite de Severidade
Ódio e imparcialidade Prompts e Conclusões Médio
Violência Prompts e Conclusões Médio
Sexual Prompts e Conclusões Médio
Automutilação Prompts e Conclusões Médio
Ataque de injeção de prompt do usuário (Jailbreak) Prompts N/D
Material Protegido – Texto Preenchimentos N/D
Material Protegido – Código Preenchimentos N/D

Modelos de visão: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o e GPT-4 Turbo

Categoria de Risco Prompt/Conclusão Limite de Severidade
Ódio e imparcialidade Prompts e Conclusões Médio
Violência Prompts e Conclusões Médio
Sexual Prompts e Conclusões Médio
Automutilação Prompts e Conclusões Médio
Identificação de indivíduos e inferência de atributos confidenciais Prompts N/D
Ataque de injeção de prompt do usuário (Jailbreak) Prompts N/D

DALL-E 3 e DALL-E 2

Categoria de Risco Prompt/Conclusão Limite de Severidade
Ódio e imparcialidade Prompts e Conclusões Baixo
Violência Prompts e Conclusões Baixo
Sexual Prompts e Conclusões Baixo
Automutilação Prompts e Conclusões Baixo
Definir as Credenciais Preenchimentos N/D
Geração Enganosa de Candidatos Políticos Prompts N/D
Representações de Figuras Públicas Prompts N/D
Ataque de injeção de prompt do usuário (Jailbreak) Prompts N/D
Material Protegido – Personagens de Arte e de Estúdio Prompts N/D
Conteúdo ofensivo Prompts N/D

Além das configurações de segurança acima, o DALL-E do OpenAI do Azure também vem com a transformação de prompt por padrão. Essa transformação ocorre em todos os prompts para melhorar a segurança do seu prompt original, especificamente nas categorias de risco de diversidade, geração enganosa de candidatos políticos, representações de figuras públicas, material protegido e outros.