Políticas de segurança de conteúdo padrão
O Serviço OpenAI do Azure inclui políticas de segurança padrão aplicadas a todos os modelos, excluindo o Azure OpenAI Whisper. Essas configurações fornecem uma experiência responsável por padrão, incluindo modelos de filtragem de conteúdo, listas de bloqueio, transformação de prompt, credenciais de conteúdo e outros.
A segurança padrão visa mitigar os riscos em diferentes categorias, como ódio e justiça, sexual, violência, automutilação, conteúdo material protegido e ataques de injeção imediata do usuário. Para saber mais sobre filtragem de conteúdo, visite nossa documentação que descreve categorias e níveis de gravidade.
Todas as políticas de segurança são configuráveis. Para saber mais sobre configurabilidade, consulte a documentação sobre como configurar a filtragem de conteúdo.
Modelos de texto
Os modelos de texto no Serviço OpenAI do Azure podem receber e gerar texto e código. Esses modelos aproveitam os filtros de conteúdo de texto do Azure para detetar e prevenir conteúdo nocivo. Este sistema funciona tanto em prompts quanto em conclusão.
Categoria de risco | Prompt/Conclusão | Limiar de gravidade |
---|---|---|
Ódio e justiça | Prompts e Conclusões | Médio |
Violência | Prompts e Conclusões | Médio |
Sexual | Prompts e Conclusões | Médio |
Automutilação | Prompts e Conclusões | Médio |
Ataque de injeção de prompt do usuário (Jailbreak) | Pedidos | N/A |
Material Protegido – Texto | Conclusões | N/A |
Material Protegido – Código | Conclusões | N/A |
Modelos de visão
Modelos de chat habilitados para visão
Categoria de risco | Prompt/Conclusão | Limiar de gravidade |
---|---|---|
Ódio e justiça | Prompts e Conclusões | Médio |
Violência | Prompts e Conclusões | Médio |
Sexual | Prompts e Conclusões | Médio |
Automutilação | Prompts e Conclusões | Médio |
Identificação de Indivíduos e Inferência de Atributos Sensíveis | Pedidos | N/A |
Ataque de injeção de prompt do usuário (Jailbreak) | Pedidos | N/A |
Modelos de geração de imagem
Categoria de risco | Prompt/Conclusão | Limiar de gravidade |
---|---|---|
Ódio e justiça | Prompts e Conclusões | Baixo |
Violência | Prompts e Conclusões | Baixo |
Sexual | Prompts e Conclusões | Baixo |
Automutilação | Prompts e Conclusões | Baixo |
Credenciais de conteúdo | Conclusões | N/A |
Geração enganosa de candidatos políticos | Pedidos | N/A |
Representações de Figuras Públicas | Pedidos | N/A |
Ataque de injeção de prompt do usuário (Jailbreak) | Pedidos | N/A |
Material Protegido – Personagens de Arte e Estúdio | Pedidos | N/A |
Palavras ofensivas | Pedidos | N/A |
Além das configurações de segurança acima, o Azure OpenAI DALL-E também vem com transformação imediata por padrão. Essa transformação ocorre em todos os prompts para aumentar a segurança do seu prompt original, especificamente nas categorias de risco de diversidade, geração enganosa de candidatos políticos, representações de figuras públicas, material protegido e outros.