Políticas de segurança de conteúdo padrão
O Serviço OpenAI do Azure inclui segurança padrão aplicada a todos os modelos, excluindo o Azure OpenAI Whisper. Essas configurações fornecem uma experiência responsável por padrão, incluindo modelos de filtragem de conteúdo, listas de bloqueio, transformação de prompt, credenciais de conteúdo e outros.
A segurança padrão visa mitigar riscos como ódio e justiça, violência sexual, automutilação, conteúdo material protegido e ataques de injeção imediata do usuário. Para saber mais sobre filtragem de conteúdo, visite nossa documentação descrevendo categorias e níveis de gravidade aqui.
Toda a segurança é configurável. Para saber mais sobre a configurabilidade, visite nossa documentação sobre como configurar a filtragem de conteúdo.
Modelos de texto: GPT-4, GPT-3.5
Os modelos de texto no Serviço OpenAI do Azure podem receber e gerar texto e código. Esses modelos aproveitam os modelos de filtragem de conteúdo de texto do Azure para detetar e prevenir conteúdo nocivo. Este sistema funciona tanto no prompt quanto na conclusão.
Categoria de risco | Prompt/Conclusão | Limiar de gravidade |
---|---|---|
Ódio e justiça | Prompts e Conclusões | Médio |
Violência | Prompts e Conclusões | Médio |
Sexual | Prompts e Conclusões | Médio |
Automutilação | Prompts e Conclusões | Médio |
Ataque de injeção de prompt do usuário (Jailbreak) | Pedidos | N/A |
Material Protegido – Texto | Conclusões | N/A |
Material Protegido – Código | Conclusões | N/A |
Modelos de visão: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2
GPT-4o e GPT-4 Turbo
Categoria de risco | Prompt/Conclusão | Limiar de gravidade |
---|---|---|
Ódio e justiça | Prompts e Conclusões | Médio |
Violência | Prompts e Conclusões | Médio |
Sexual | Prompts e Conclusões | Médio |
Automutilação | Prompts e Conclusões | Médio |
Identificação de Indivíduos e Inferência de Atributos Sensíveis | Pedidos | N/A |
Ataque de injeção de prompt do usuário (Jailbreak) | Pedidos | N/A |
DALL-E 3 e DALL-E 2
Categoria de risco | Prompt/Conclusão | Limiar de gravidade |
---|---|---|
Ódio e justiça | Prompts e Conclusões | Baixo |
Violência | Prompts e Conclusões | Baixo |
Sexual | Prompts e Conclusões | Baixo |
Automutilação | Prompts e Conclusões | Baixo |
Credenciais de conteúdo | Conclusões | N/A |
Geração enganosa de candidatos políticos | Pedidos | N/A |
Representações de Figuras Públicas | Pedidos | N/A |
Ataque de injeção de prompt do usuário (Jailbreak) | Pedidos | N/A |
Material Protegido – Personagens de Arte e Estúdio | Pedidos | N/A |
Palavras ofensivas | Pedidos | N/A |
Além das configurações de segurança acima, o Azure OpenAI DALL-E também vem com transformação imediata por padrão. Essa transformação ocorre em todos os prompts para aumentar a segurança do seu prompt original, especificamente nas categorias de risco de diversidade, geração enganosa de candidatos políticos, representações de figuras públicas, material protegido e outros.