Výchozí zásady zabezpečení obsahu pro odvozování modelů Azure AI

Článek
01/30/2025

Odvozování modelů Azure AI zahrnuje výchozí bezpečnost použitou u všech modelů, s výjimkou Azure OpenAI Whisper. Tyto konfigurace poskytují ve výchozím nastavení zodpovědné prostředí.

Cílem výchozí bezpečnosti je zmírnit rizika, jako jsou nenávist a nestrannost, sexuální, násilí, sebepoškozování, chráněný materiálový obsah a útoky prostřednictvím injektáže uživatelů. Další informace o filtrování obsahu najdete v naší dokumentaci popisující kategorie a úrovně závažnosti.

Tento dokument popisuje výchozí konfiguraci.

Tip

Ve výchozím nastavení používají všechna nasazení modelu výchozí konfiguraci. Filtrování obsahu na nasazení modelu ale můžete nakonfigurovat, jak je vysvětleno v tématu Konfigurace filtrování obsahu.

Textové modely

Textové modely v odvozování modelu Azure AI můžou převzít a generovat text i kód. Tyto modely používají modely filtrování textového obsahu Azure k detekci a prevenci škodlivého obsahu. Tento systém funguje na příkazovém řádku i na dokončení.

Kategorie rizika	Výzva/dokončení	Prahová hodnota závažnosti
Nenávist a nestrannost	Výzvy a dokončení	Střední
Násilí	Výzvy a dokončení	Střední
Sexuální	Výzvy a dokončení	Střední
Sebepoškozování	Výzvy a dokončení	Střední
Útok prostřednictvím injektáže uživatele (Jailbreak)	Výzvy	–
Chráněný materiál – text	Dokončení	–
Chráněný materiál – kód	Dokončení	–

Zpracování obrazu a chatu s modely zpracování obrazu

Modely zpracování obrazu můžou najednou pořizovat text i obrázky jako součást vstupu. Výchozí možnosti filtrování obsahu se liší podle modelu a poskytovatele.

Azure OpenAI: GPT-4o a GPT-4 Turbo

Kategorie rizika	Výzva/dokončení	Prahová hodnota závažnosti
Nenávist a nestrannost	Výzvy a dokončení	Střední
Násilí	Výzvy a dokončení	Střední
Sexuální	Výzvy a dokončení	Střední
Sebepoškozování	Výzvy a dokončení	Střední
Identifikace jednotlivců a odvození citlivých atributů	Výzvy	–
Útok prostřednictvím injektáže uživatele (Jailbreak)	Výzvy	–

Azure OpenAI: DALL-E 3 a DALL-E 2

Kategorie rizika	Výzva/dokončení	Prahová hodnota závažnosti
Nenávist a nestrannost	Výzvy a dokončení	Nízká
Násilí	Výzvy a dokončení	Nízká
Sexuální	Výzvy a dokončení	Nízká
Sebepoškozování	Výzvy a dokončení	Nízká
Přihlašovací údaje k obsahu	Dokončení	–
Deceptivní generace politických kandidátů	Výzvy	–
Znázornění veřejných obrázků	Výzvy	–
Útok prostřednictvím injektáže uživatele (Jailbreak)	Výzvy	–
Chráněný materiál – umělecké a studiové znaky	Výzvy	–
Vulgární výrazy	Výzvy	–

Kromě předchozích bezpečnostních konfigurací nabízí Azure OpenAI DALL-E ve výchozím nastavení také výzvu k transformaci . K této transformaci dochází na všech výzev k posílení bezpečnosti původní výzvy, konkrétně v rizikových kategoriích rozmanitosti, deceptivní generaci politických kandidátů, znázornění veřejných osobností, chráněných materiálů a dalších.

Meta: Llama-3.2-11B-Vision-Instruct a Llama-3.2-90B-Vision-Instruct

Filtry obsahu se vztahují pouze na textové výzvy a dokončení. Obrázky nejsou předmětem kon režim stanu race.

Microsoft: Phi-3.5-vision-instruct

Filtry obsahu se vztahují pouze na textové výzvy a dokončení. Obrázky nejsou předmětem kon režim stanu race.

Další kroky

Konfigurace filtrů obsahu v odvozování modelu Azure AI

Sdílet prostřednictvím