Standaardbeleid voor inhoudsveiligheid voor Azure AI-modeldeductie
Azure AI-modeldeductie omvat standaardveiligheid die wordt toegepast op alle modellen, met uitzondering van Azure OpenAI Whisper. Deze configuraties bieden u standaard een verantwoorde ervaring.
Standaardveiligheid is gericht op het beperken van risico's zoals haat en billijkheid, seksueel, geweld, zelfbeschadiging, beveiligde materiaalinhoud en aanvallen van gebruikersprompts. Lees onze documentatie over categorieën en ernstniveaus voor meer informatie over inhoudsfiltering.
In dit document wordt de standaardconfiguratie beschreven.
Tip
Standaard gebruiken alle modelimplementaties de standaardconfiguratie. U kunt echter inhoudsfilters per modelimplementatie configureren, zoals wordt uitgelegd bij Het configureren van inhoudsfilters.
Tekstmodellen
Tekstmodellen in Azure AI-modeldeductie kunnen zowel tekst als code in beslag nemen en genereren. Met deze modellen worden de modellen voor het filteren van tekstinhoud van Azure toegepast om schadelijke inhoud te detecteren en te voorkomen. Dit systeem werkt zowel bij prompt als voltooiing.
Risicocategorie | Prompt/voltooiing | Drempelwaarde voor ernst |
---|---|---|
Haat en billijkheid | Prompts en voltooiingen | Gemiddeld |
Geweld | Prompts en voltooiingen | Gemiddeld |
Seksueel | Prompts en voltooiingen | Gemiddeld |
Zelfschade | Prompts en voltooiingen | Gemiddeld |
Aanval van gebruikerspromptinjectie (Jailbreak) | Prompts | N.v.t. |
Beschermd materiaal – tekst | Voltooiingen | N.v.t. |
Beschermd materiaal – Code | Voltooiingen | N.v.t. |
Visie en chatten met vision-modellen
Vision-modellen kunnen zowel tekst als afbeeldingen tegelijk gebruiken als onderdeel van de invoer. De standaardmogelijkheden voor inhoudsfilters verschillen per model en provider.
Azure OpenAI: GPT-4o en GPT-4 Turbo
Risicocategorie | Prompt/voltooiing | Drempelwaarde voor ernst |
---|---|---|
Haat en billijkheid | Prompts en voltooiingen | Gemiddeld |
Geweld | Prompts en voltooiingen | Gemiddeld |
Seksueel | Prompts en voltooiingen | Gemiddeld |
Zelfschade | Prompts en voltooiingen | Gemiddeld |
Identificatie van individuen en deductie van gevoelige kenmerken | Prompts | N.v.t. |
Aanval van gebruikerspromptinjectie (Jailbreak) | Prompts | N.v.t. |
Azure OpenAI: DALL-E 3 en DALL-E 2
Risicocategorie | Prompt/voltooiing | Drempelwaarde voor ernst |
---|---|---|
Haat en billijkheid | Prompts en voltooiingen | Beperkt |
Geweld | Prompts en voltooiingen | Beperkt |
Seksueel | Prompts en voltooiingen | Beperkt |
Zelfschade | Prompts en voltooiingen | Beperkt |
Referenties voor inhoud | Voltooiingen | N.v.t. |
Misleidende generatie politieke kandidaten | Prompts | N.v.t. |
Afbeeldingen van openbare figuren | Prompts | N.v.t. |
Aanval van gebruikerspromptinjectie (Jailbreak) | Prompts | N.v.t. |
Beschermd materiaal – Illustraties en Studio-tekens | Prompts | N.v.t. |
Aanstootgevend taalgebruik | Prompts | N.v.t. |
Naast de vorige veiligheidsconfiguraties wordt Azure OpenAI DALL-E ook standaard geleverd met prompttransformatie . Deze transformatie vindt plaats op alle aanwijzingen om de veiligheid van uw oorspronkelijke prompt te verbeteren, met name in de risicocategorieën van diversiteit, misleidende generatie politieke kandidaten, afbeeldingen van publieke figuren, beschermd materiaal en andere.
Meta: Llama-3.2-11B-Vision-Instruct and Llama-3.2-90B-Vision-Instruct
Inhoudsfilters zijn alleen van toepassing op tekstprompts en voltooiingen. Afbeeldingen zijn niet onderworpen aan con tentmodus ration.
Microsoft: Phi-3.5-vision-instruct
Inhoudsfilters zijn alleen van toepassing op tekstprompts en voltooiingen. Afbeeldingen zijn niet onderworpen aan con tentmodus ration.