Criteri di sicurezza dei contenuti predefiniti per l'inferenza del modello di intelligenza artificiale di Azure

Articolo
01/30/2025

L'inferenza del modello di intelligenza artificiale di Azure include la sicurezza predefinita applicata a tutti i modelli, escluso Azure OpenAI Whisper. Queste configurazioni offrono un'esperienza responsabile per impostazione predefinita.

La sicurezza predefinita mira a mitigare i rischi come odio e equità, sesso, violenza, autolesionismo, contenuto materiale protetto e attacchi di inserimento richieste dall'utente. Per altre informazioni sul filtro dei contenuti, leggere la documentazione che descrive le categorie e i livelli di gravità.

Questo documento descrive la configurazione predefinita.

Suggerimento

Per impostazione predefinita, tutte le distribuzioni di modelli usano la configurazione predefinita. Tuttavia, è possibile configurare il filtro del contenuto per ogni distribuzione del modello, come illustrato in Configurazione del filtro del contenuto.

Modelli di testo

I modelli di testo nell'inferenza del modello di intelligenza artificiale di Azure possono accettare e generare testo e codice. Questi modelli applicano i modelli di filtro del contenuto di testo di Azure per rilevare e prevenire contenuti dannosi. Questo sistema funziona sia su prompt che su completamento.

Categoria di rischio	Prompt/completamento	Soglia di gravità
Odio ed equità	Prompt e completamenti	Medio
Violenza	Prompt e completamenti	Medio
Sessuale	Prompt e completamenti	Medio
Autolesionismo	Prompt e completamenti	Medio
Attacco di prompt injection dell'utente (manomissione con jailbreak)	Prompt	N/D
Materiale protetto - testo	Completamenti	N/D
Materiale protetto - codice	Completamenti	N/D

Visione e chat con i modelli di visione

I modelli di visione possono accettare testo e immagini contemporaneamente all'input. Le funzionalità di filtro del contenuto predefinite variano in base al modello e al provider.

Azure OpenAI: GPT-4o e GPT-4 Turbo

Categoria di rischio	Prompt/completamento	Soglia di gravità
Odio ed equità	Prompt e completamenti	Medio
Violenza	Prompt e completamenti	Medio
Sessuale	Prompt e completamenti	Medio
Autolesionismo	Prompt e completamenti	Medio
Identificazione di singoli utenti e inferenza di attributi sensibili	Prompt	N/D
Attacco di prompt injection dell'utente (manomissione con jailbreak)	Prompt	N/D

Azure OpenAI: DALL-E 3 e DALL-E 2

Categoria di rischio	Prompt/completamento	Soglia di gravità
Odio ed equità	Prompt e completamenti	Basso
Violenza	Prompt e completamenti	Basso
Sessuale	Prompt e completamenti	Basso
Autolesionismo	Prompt e completamenti	Basso
Credenziali del contenuto	Completamenti	N/D
Generazione ingannevole di candidati politici	Prompt	N/D
Rappresentazioni di figure pubbliche	Prompt	N/D
Attacco di prompt injection dell'utente (manomissione con jailbreak)	Prompt	N/D
Materiale protetto - personaggi di arte e studio	Prompt	N/D
Contenuto volgare	Prompt	N/D

Oltre alle configurazioni di sicurezza precedenti, Azure OpenAI DALL-E include anche la trasformazione prompt per impostazione predefinita. Questa trasformazione si verifica su tutti i prompt per migliorare la sicurezza della richiesta originale, in particolare nelle categorie di rischio di diversità, generazione ingannevole di candidati politici, rappresentazioni di figure pubbliche, materiale protetto e altri.

Meta: Llama-3.2-11B-Vision-Instruct e Llama-3.2-90B-Vision-Instruct

I filtri contenuto si applicano solo alle richieste di testo e ai completamenti. Le immagini non sono soggette a con modalità tenda ration.

Microsoft: Phi-3.5-vision-instruct

I filtri contenuto si applicano solo alle richieste di testo e ai completamenti. Le immagini non sono soggette a con modalità tenda ration.

Passaggi successivi

Configurare i filtri di contenuto nell'inferenza del modello di intelligenza artificiale di Azure

Condividi tramite