Políticas de segurança de conteúdo padrão

Artigo
02/25/2025

O Serviço OpenAI do Azure inclui políticas de segurança padrão aplicadas a todos os modelos, excluindo o Azure OpenAI Whisper. Essas configurações fornecem uma experiência responsável por padrão, incluindo modelos de filtragem de conteúdo, listas de bloqueio, transformação de prompt, credenciais de conteúdo e outros.

A segurança padrão visa mitigar os riscos em diferentes categorias, como ódio e justiça, sexual, violência, automutilação, conteúdo material protegido e ataques de injeção imediata do usuário. Para saber mais sobre filtragem de conteúdo, visite nossa documentação que descreve categorias e níveis de gravidade.

Todas as políticas de segurança são configuráveis. Para saber mais sobre configurabilidade, consulte a documentação sobre como configurar a filtragem de conteúdo.

Modelos de texto

Os modelos de texto no Serviço OpenAI do Azure podem receber e gerar texto e código. Esses modelos aproveitam os filtros de conteúdo de texto do Azure para detetar e prevenir conteúdo nocivo. Este sistema funciona tanto em prompts quanto em conclusão.

Categoria de risco	Prompt/Conclusão	Limiar de gravidade
Ódio e justiça	Prompts e Conclusões	Médio
Violência	Prompts e Conclusões	Médio
Sexual	Prompts e Conclusões	Médio
Automutilação	Prompts e Conclusões	Médio
Ataque de injeção de prompt do usuário (Jailbreak)	Pedidos	N/A
Material Protegido – Texto	Conclusões	N/A
Material Protegido – Código	Conclusões	N/A

Modelos de visão

Modelos de chat habilitados para visão

Categoria de risco	Prompt/Conclusão	Limiar de gravidade
Ódio e justiça	Prompts e Conclusões	Médio
Violência	Prompts e Conclusões	Médio
Sexual	Prompts e Conclusões	Médio
Automutilação	Prompts e Conclusões	Médio
Identificação de Indivíduos e Inferência de Atributos Sensíveis	Pedidos	N/A
Ataque de injeção de prompt do usuário (Jailbreak)	Pedidos	N/A

Modelos de geração de imagem

Categoria de risco	Prompt/Conclusão	Limiar de gravidade
Ódio e justiça	Prompts e Conclusões	Baixo
Violência	Prompts e Conclusões	Baixo
Sexual	Prompts e Conclusões	Baixo
Automutilação	Prompts e Conclusões	Baixo
Credenciais de conteúdo	Conclusões	N/A
Geração enganosa de candidatos políticos	Pedidos	N/A
Representações de Figuras Públicas	Pedidos	N/A
Ataque de injeção de prompt do usuário (Jailbreak)	Pedidos	N/A
Material Protegido – Personagens de Arte e Estúdio	Pedidos	N/A
Palavras ofensivas	Pedidos	N/A

Além das configurações de segurança acima, o Azure OpenAI DALL-E também vem com transformação imediata por padrão. Essa transformação ocorre em todos os prompts para aumentar a segurança do seu prompt original, especificamente nas categorias de risco de diversidade, geração enganosa de candidatos políticos, representações de figuras públicas, material protegido e outros.

Partilhar via

Políticas de segurança de conteúdo padrão

Modelos de texto

Modelos de visão

Modelos de chat habilitados para visão

Modelos de geração de imagem

Comentários

Recursos adicionais