Výchozí zásady zabezpečení obsahu pro odvozování modelů Azure AI
Odvozování modelů Azure AI zahrnuje výchozí bezpečnost použitou u všech modelů, s výjimkou Azure OpenAI Whisper. Tyto konfigurace poskytují ve výchozím nastavení zodpovědné prostředí.
Cílem výchozí bezpečnosti je zmírnit rizika, jako jsou nenávist a nestrannost, sexuální, násilí, sebepoškozování, chráněný materiálový obsah a útoky prostřednictvím injektáže uživatelů. Další informace o filtrování obsahu najdete v naší dokumentaci popisující kategorie a úrovně závažnosti.
Tento dokument popisuje výchozí konfiguraci.
Tip
Ve výchozím nastavení používají všechna nasazení modelu výchozí konfiguraci. Filtrování obsahu na nasazení modelu ale můžete nakonfigurovat, jak je vysvětleno v tématu Konfigurace filtrování obsahu.
Textové modely
Textové modely v odvozování modelu Azure AI můžou převzít a generovat text i kód. Tyto modely používají modely filtrování textového obsahu Azure k detekci a prevenci škodlivého obsahu. Tento systém funguje na příkazovém řádku i na dokončení.
Kategorie rizika | Výzva/dokončení | Prahová hodnota závažnosti |
---|---|---|
Nenávist a nestrannost | Výzvy a dokončení | Střední |
Násilí | Výzvy a dokončení | Střední |
Sexuální | Výzvy a dokončení | Střední |
Sebepoškozování | Výzvy a dokončení | Střední |
Útok prostřednictvím injektáže uživatele (Jailbreak) | Výzvy | – |
Chráněný materiál – text | Dokončení | – |
Chráněný materiál – kód | Dokončení | – |
Zpracování obrazu a chatu s modely zpracování obrazu
Modely zpracování obrazu můžou najednou pořizovat text i obrázky jako součást vstupu. Výchozí možnosti filtrování obsahu se liší podle modelu a poskytovatele.
Azure OpenAI: GPT-4o a GPT-4 Turbo
Kategorie rizika | Výzva/dokončení | Prahová hodnota závažnosti |
---|---|---|
Nenávist a nestrannost | Výzvy a dokončení | Střední |
Násilí | Výzvy a dokončení | Střední |
Sexuální | Výzvy a dokončení | Střední |
Sebepoškozování | Výzvy a dokončení | Střední |
Identifikace jednotlivců a odvození citlivých atributů | Výzvy | – |
Útok prostřednictvím injektáže uživatele (Jailbreak) | Výzvy | – |
Azure OpenAI: DALL-E 3 a DALL-E 2
Kategorie rizika | Výzva/dokončení | Prahová hodnota závažnosti |
---|---|---|
Nenávist a nestrannost | Výzvy a dokončení | Nízká |
Násilí | Výzvy a dokončení | Nízká |
Sexuální | Výzvy a dokončení | Nízká |
Sebepoškozování | Výzvy a dokončení | Nízká |
Přihlašovací údaje k obsahu | Dokončení | – |
Deceptivní generace politických kandidátů | Výzvy | – |
Znázornění veřejných obrázků | Výzvy | – |
Útok prostřednictvím injektáže uživatele (Jailbreak) | Výzvy | – |
Chráněný materiál – umělecké a studiové znaky | Výzvy | – |
Vulgární výrazy | Výzvy | – |
Kromě předchozích bezpečnostních konfigurací nabízí Azure OpenAI DALL-E ve výchozím nastavení také výzvu k transformaci . K této transformaci dochází na všech výzev k posílení bezpečnosti původní výzvy, konkrétně v rizikových kategoriích rozmanitosti, deceptivní generaci politických kandidátů, znázornění veřejných osobností, chráněných materiálů a dalších.
Meta: Llama-3.2-11B-Vision-Instruct a Llama-3.2-90B-Vision-Instruct
Filtry obsahu se vztahují pouze na textové výzvy a dokončení. Obrázky nejsou předmětem kon režim stanu race.
Microsoft: Phi-3.5-vision-instruct
Filtry obsahu se vztahují pouze na textové výzvy a dokončení. Obrázky nejsou předmětem kon režim stanu race.