Standaardbeleid voor inhoudsveiligheid

Artikel
02/25/2025

Azure OpenAI Service bevat standaardbeveiligingsbeleid dat is toegepast op alle modellen, met uitzondering van Azure OpenAI Whisper. Deze configuraties bieden u standaard een verantwoorde ervaring, waaronder modellen voor inhoudsfilters, bloklijsten, prompttransformatie, inhoudsreferenties en andere.

Standaardveiligheid is gericht op het beperken van risico's in verschillende categorieën, zoals haat en billijkheid, seksueel, geweld, zelfbeschadiging, beveiligde materiaalinhoud en aanvallen van gebruikerspromptinjecties. Raadpleeg onze documentatie waarin categorieën en ernstniveaus worden beschreven voor meer informatie over het filteren van inhoud.

Alle veiligheidsbeleidsregels kunnen worden geconfigureerd. Zie de documentatie over het configureren van inhoudsfilters voor meer informatie over de configureerbaarheid.

Tekstmodellen

Tekstmodellen in de Azure OpenAI-service kunnen zowel tekst als code in beslag nemen en genereren. Deze modellen maken gebruik van de tekstinhoudsfilters van Azure om schadelijke inhoud te detecteren en te voorkomen. Dit systeem werkt op zowel prompts als voltooiingen.

Risicocategorie	Prompt/voltooiing	Drempelwaarde voor ernst
Haat en billijkheid	Prompts en voltooiingen	Gemiddeld
Geweld	Prompts en voltooiingen	Gemiddeld
Seksueel	Prompts en voltooiingen	Gemiddeld
Zelfschade	Prompts en voltooiingen	Gemiddeld
Aanval van gebruikerspromptinjectie (Jailbreak)	Prompts	N.v.t.
Beschermd materiaal – tekst	Voltooiingen	N.v.t.
Beschermd materiaal – Code	Voltooiingen	N.v.t.

Vision-modellen

Vision-chatmodellen

Risicocategorie	Prompt/voltooiing	Drempelwaarde voor ernst
Haat en billijkheid	Prompts en voltooiingen	Gemiddeld
Geweld	Prompts en voltooiingen	Gemiddeld
Seksueel	Prompts en voltooiingen	Gemiddeld
Zelfschade	Prompts en voltooiingen	Gemiddeld
Identificatie van individuen en deductie van gevoelige kenmerken	Prompts	N.v.t.
Aanval van gebruikerspromptinjectie (Jailbreak)	Prompts	N.v.t.

Modellen voor het genereren van installatiekopieën

Risicocategorie	Prompt/voltooiing	Drempelwaarde voor ernst
Haat en billijkheid	Prompts en voltooiingen	Beperkt
Geweld	Prompts en voltooiingen	Beperkt
Seksueel	Prompts en voltooiingen	Beperkt
Zelfschade	Prompts en voltooiingen	Beperkt
Referenties voor inhoud	Voltooiingen	N.v.t.
Misleidende generatie politieke kandidaten	Prompts	N.v.t.
Afbeeldingen van openbare figuren	Prompts	N.v.t.
Aanval van gebruikerspromptinjectie (Jailbreak)	Prompts	N.v.t.
Beschermd materiaal – Illustraties en Studio-tekens	Prompts	N.v.t.
Aanstootgevend taalgebruik	Prompts	N.v.t.

Naast de bovenstaande veiligheidsconfiguraties wordt Azure OpenAI DALL-E standaard ook geleverd met prompttransformatie . Deze transformatie vindt plaats op alle aanwijzingen om de veiligheid van uw oorspronkelijke prompt te verbeteren, met name in de risicocategorieën van diversiteit, misleidende generatie politieke kandidaten, afbeeldingen van publieke figuren, beschermd materiaal en andere.

Delen via

Standaardbeleid voor inhoudsveiligheid

Tekstmodellen

Vision-modellen

Vision-chatmodellen

Modellen voor het genereren van installatiekopieën

Feedback

Aanvullende resources