Sdílet prostřednictvím


Výchozí zásady zabezpečení obsahu pro odvozování modelů Azure AI

Odvozování modelů Azure AI zahrnuje výchozí bezpečnost použitou u všech modelů, s výjimkou Azure OpenAI Whisper. Tyto konfigurace poskytují ve výchozím nastavení zodpovědné prostředí.

Cílem výchozí bezpečnosti je zmírnit rizika, jako jsou nenávist a nestrannost, sexuální, násilí, sebepoškozování, chráněný materiálový obsah a útoky prostřednictvím injektáže uživatelů. Další informace o filtrování obsahu najdete v naší dokumentaci popisující kategorie a úrovně závažnosti.

Tento dokument popisuje výchozí konfiguraci.

Tip

Ve výchozím nastavení používají všechna nasazení modelu výchozí konfiguraci. Filtrování obsahu na nasazení modelu ale můžete nakonfigurovat, jak je vysvětleno v tématu Konfigurace filtrování obsahu.

Textové modely

Textové modely v odvozování modelu Azure AI můžou převzít a generovat text i kód. Tyto modely používají modely filtrování textového obsahu Azure k detekci a prevenci škodlivého obsahu. Tento systém funguje na příkazovém řádku i na dokončení.

Kategorie rizika Výzva/dokončení Prahová hodnota závažnosti
Nenávist a nestrannost Výzvy a dokončení Střední
Násilí Výzvy a dokončení Střední
Sexuální Výzvy a dokončení Střední
Sebepoškozování Výzvy a dokončení Střední
Útok prostřednictvím injektáže uživatele (Jailbreak) Výzvy
Chráněný materiál – text Dokončení
Chráněný materiál – kód Dokončení

Zpracování obrazu a chatu s modely zpracování obrazu

Modely zpracování obrazu můžou najednou pořizovat text i obrázky jako součást vstupu. Výchozí možnosti filtrování obsahu se liší podle modelu a poskytovatele.

Azure OpenAI: GPT-4o a GPT-4 Turbo

Kategorie rizika Výzva/dokončení Prahová hodnota závažnosti
Nenávist a nestrannost Výzvy a dokončení Střední
Násilí Výzvy a dokončení Střední
Sexuální Výzvy a dokončení Střední
Sebepoškozování Výzvy a dokončení Střední
Identifikace jednotlivců a odvození citlivých atributů Výzvy
Útok prostřednictvím injektáže uživatele (Jailbreak) Výzvy

Azure OpenAI: DALL-E 3 a DALL-E 2

Kategorie rizika Výzva/dokončení Prahová hodnota závažnosti
Nenávist a nestrannost Výzvy a dokončení Nízká
Násilí Výzvy a dokončení Nízká
Sexuální Výzvy a dokončení Nízká
Sebepoškozování Výzvy a dokončení Nízká
Přihlašovací údaje k obsahu Dokončení
Deceptivní generace politických kandidátů Výzvy
Znázornění veřejných obrázků Výzvy
Útok prostřednictvím injektáže uživatele (Jailbreak) Výzvy
Chráněný materiál – umělecké a studiové znaky Výzvy
Vulgární výrazy Výzvy

Kromě předchozích bezpečnostních konfigurací nabízí Azure OpenAI DALL-E ve výchozím nastavení také výzvu k transformaci . K této transformaci dochází na všech výzev k posílení bezpečnosti původní výzvy, konkrétně v rizikových kategoriích rozmanitosti, deceptivní generaci politických kandidátů, znázornění veřejných osobností, chráněných materiálů a dalších.

Meta: Llama-3.2-11B-Vision-Instruct a Llama-3.2-90B-Vision-Instruct

Filtry obsahu se vztahují pouze na textové výzvy a dokončení. Obrázky nejsou předmětem kon režim stanu race.

Microsoft: Phi-3.5-vision-instruct

Filtry obsahu se vztahují pouze na textové výzvy a dokončení. Obrázky nejsou předmětem kon režim stanu race.

Další kroky