Políticas de segurança de conteúdo padrão

Artigo
09/03/2024

O Serviço OpenAI do Azure inclui segurança padrão aplicada a todos os modelos, excluindo o Whisper do OpenAI do Azure Essas configurações fornecem uma experiência responsável por padrão, incluindo modelos de filtragem de conteúdo, listas de bloqueio, transformação de prompt, credenciais de conteúdo e outros.

A segurança padrão visa mitigar riscos como ódio e imparcialidade, sexual, violência, automutilação, conteúdo material protegido e ataques de injeção de solicitação de usuário. Para saber mais sobre filtragem de conteúdo, visite nossa documentação que descreve categorias e níveis de gravidade aqui.

Toda a segurança é configurável. Para saber mais sobre a configurabilidade, visite nossa documentação sobre como configurar a filtragem de conteúdo.

Modelos de texto: GPT-4, GPT-3.5

Os modelos de texto no Serviço OpenAI do Azure podem receber e gerar texto e código. Esses modelos aproveitam os modelos de filtragem de conteúdo de texto do Azure para detectar e evitar conteúdo prejudicial. Esse sistema funciona no prompt e na conclusão.

Categoria de Risco	Prompt/Conclusão	Limite de Severidade
Ódio e imparcialidade	Prompts e Conclusões	Médio
Violência	Prompts e Conclusões	Médio
Sexual	Prompts e Conclusões	Médio
Automutilação	Prompts e Conclusões	Médio
Ataque de injeção de prompt do usuário (Jailbreak)	Prompts	N/D
Material Protegido – Texto	Preenchimentos	N/D
Material Protegido – Código	Preenchimentos	N/D

Modelos de visão: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o e GPT-4 Turbo

Categoria de Risco	Prompt/Conclusão	Limite de Severidade
Ódio e imparcialidade	Prompts e Conclusões	Médio
Violência	Prompts e Conclusões	Médio
Sexual	Prompts e Conclusões	Médio
Automutilação	Prompts e Conclusões	Médio
Identificação de indivíduos e inferência de atributos confidenciais	Prompts	N/D
Ataque de injeção de prompt do usuário (Jailbreak)	Prompts	N/D

DALL-E 3 e DALL-E 2

Categoria de Risco	Prompt/Conclusão	Limite de Severidade
Ódio e imparcialidade	Prompts e Conclusões	Baixo
Violência	Prompts e Conclusões	Baixo
Sexual	Prompts e Conclusões	Baixo
Automutilação	Prompts e Conclusões	Baixo
Definir as Credenciais	Preenchimentos	N/D
Geração Enganosa de Candidatos Políticos	Prompts	N/D
Representações de Figuras Públicas	Prompts	N/D
Ataque de injeção de prompt do usuário (Jailbreak)	Prompts	N/D
Material Protegido – Personagens de Arte e de Estúdio	Prompts	N/D
Conteúdo ofensivo	Prompts	N/D

Além das configurações de segurança acima, o DALL-E do OpenAI do Azure também vem com a transformação de prompt por padrão. Essa transformação ocorre em todos os prompts para melhorar a segurança do seu prompt original, especificamente nas categorias de risco de diversidade, geração enganosa de candidatos políticos, representações de figuras públicas, material protegido e outros.

Compartilhar via

Políticas de segurança de conteúdo padrão

Modelos de texto: GPT-4, GPT-3.5

Modelos de visão: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o e GPT-4 Turbo

DALL-E 3 e DALL-E 2

Comentários

Recursos adicionais