Standaardbeleid voor inhoudsveiligheid
Azure OpenAI Service bevat standaardveiligheid die is toegepast op alle modellen, met uitzondering van Azure OpenAI Whisper. Deze configuraties bieden u standaard een verantwoorde ervaring, waaronder modellen voor inhoudsfilters, bloklijsten, prompttransformatie, inhoudsreferenties en andere.
Standaardveiligheid is gericht op het beperken van risico's zoals haat en billijkheid, seksueel, geweld, zelfbeschadiging, beveiligde materiaalinhoud en aanvallen van gebruikersprompts. Voor meer informatie over het filteren van inhoud raadpleegt u onze documentatie waarin categorieën en ernstniveaus worden beschreven.
Alle veiligheid kan worden geconfigureerd. Raadpleeg onze documentatie over het configureren van inhoudsfiltering voor meer informatie over de configureerbaarheid.
Tekstmodellen: GPT-4, GPT-3.5
Tekstmodellen in de Azure OpenAI-service kunnen zowel tekst als code in beslag nemen en genereren. Deze modellen maken gebruik van de modellen voor het filteren van tekstinhoud van Azure om schadelijke inhoud te detecteren en te voorkomen. Dit systeem werkt zowel bij prompt als voltooiing.
Risicocategorie | Prompt/voltooiing | Drempelwaarde voor ernst |
---|---|---|
Haat en billijkheid | Prompts en voltooiingen | Gemiddeld |
Geweld | Prompts en voltooiingen | Gemiddeld |
Seksueel | Prompts en voltooiingen | Gemiddeld |
Zelfschade | Prompts en voltooiingen | Gemiddeld |
Aanval van gebruikerspromptinjectie (Jailbreak) | Prompts | N.v.t. |
Beschermd materiaal – tekst | Voltooiingen | N.v.t. |
Beschermd materiaal – Code | Voltooiingen | N.v.t. |
Vision modellen: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2
GPT-4o en GPT-4 Turbo
Risicocategorie | Prompt/voltooiing | Drempelwaarde voor ernst |
---|---|---|
Haat en billijkheid | Prompts en voltooiingen | Gemiddeld |
Geweld | Prompts en voltooiingen | Gemiddeld |
Seksueel | Prompts en voltooiingen | Gemiddeld |
Zelfschade | Prompts en voltooiingen | Gemiddeld |
Identificatie van individuen en deductie van gevoelige kenmerken | Prompts | N.v.t. |
Aanval van gebruikerspromptinjectie (Jailbreak) | Prompts | N.v.t. |
DALL-E 3 en DALL-E 2
Risicocategorie | Prompt/voltooiing | Drempelwaarde voor ernst |
---|---|---|
Haat en billijkheid | Prompts en voltooiingen | Beperkt |
Geweld | Prompts en voltooiingen | Beperkt |
Seksueel | Prompts en voltooiingen | Beperkt |
Zelfschade | Prompts en voltooiingen | Beperkt |
Referenties voor inhoud | Voltooiingen | N.v.t. |
Misleidende generatie politieke kandidaten | Prompts | N.v.t. |
Afbeeldingen van openbare figuren | Prompts | N.v.t. |
Aanval van gebruikerspromptinjectie (Jailbreak) | Prompts | N.v.t. |
Beschermd materiaal – Illustraties en Studio-tekens | Prompts | N.v.t. |
Aanstootgevend taalgebruik | Prompts | N.v.t. |
Naast de bovenstaande veiligheidsconfiguraties wordt Azure OpenAI DALL-E standaard ook geleverd met prompttransformatie . Deze transformatie vindt plaats op alle aanwijzingen om de veiligheid van uw oorspronkelijke prompt te verbeteren, met name in de risicocategorieën van diversiteit, misleidende generatie politieke kandidaten, afbeeldingen van publieke figuren, beschermd materiaal en andere.