Sdílet prostřednictvím


Jak nakonfigurovat filtry obsahu pomocí Azure AI Foundry

Systém filtrování obsahu integrovaný do Azure AI Foundry běží společně s základními modely, včetně modelů generování imagí DALL-E. Používá soubor klasifikačních modelů s více třídami k detekci čtyř kategorií škodlivého obsahu (násilí, nenávist, sexuální a sebepoškozování) na čtyřech úrovních závažnosti (bezpečné, nízké, střední a vysoké) a volitelných binárních klasifikátorů pro detekci rizika jailbreaku, stávajícího textu a kódu ve veřejných úložištích.

Výchozí konfigurace filtrování obsahu je nastavená tak, aby se filtrovalo na střední prahovou hodnotu závažnosti pro všechny čtyři kategorie škodlivého obsahu pro výzvy i dokončení. To znamená, že obsah, který je zjištěn na střední nebo vysoké úrovni závažnosti, je filtrován, zatímco obsah zjištěný na úrovni závažnosti nízké nebo bezpečné filtry obsahu nefiltrují. Další informace o kategoriích obsahu, úrovních závažnosti a chování systému filtrování obsahu najdete tady.

Detekce rizik jailbreaku a chráněné modely textu a kódu jsou ve výchozím nastavení volitelné a zapnuté. Funkce konfigurovatelnosti umožňuje všem zákazníkům zapnout a vypnout modely s jailbreakem a chráněným textem a kódem. Modely jsou ve výchozím nastavení zapnuté a dají se podle vašeho scénáře vypnout. Některé modely musí být zapnuté pro určité scénáře, aby se zachovalo pokrytí v rámci závazku pro autorská práva zákazníka.

Poznámka:

Všichni zákazníci mají možnost upravit filtry obsahu a nakonfigurovat prahové hodnoty závažnosti (nízká, střední, vysoká). Schválení se vyžaduje pro částečné nebo úplné vypnutí filtrů obsahu. Pouze spravovaní zákazníci můžou požádat o úplné řízení filtrování obsahu prostřednictvím tohoto formuláře Kontrola omezeného přístupu Azure OpenAI: Upravené filtry obsahu. V tuto chvíli není možné se stát spravovaným zákazníkem.

Filtry obsahu je možné nakonfigurovat na úrovni prostředku. Po vytvoření nové konfigurace je možné ji přidružit k jednomu nebo několika nasazením. Další informace o nasazení modelu najdete v tématu Průvodce nasazením prostředku.

Požadavky

  • Abyste mohli nakonfigurovat filtry obsahu, musíte mít prostředek Azure OpenAI a nasazení velkého jazykového modelu (LLM). Začněte podle rychlého startu .

Vysvětlení konfigurovatelnosti filtru obsahu

Služba Azure OpenAI zahrnuje výchozí nastavení zabezpečení použitá pro všechny modely s výjimkou Azure OpenAI Whisper. Tyto konfigurace poskytují ve výchozím nastavení zodpovědné prostředí, včetně modelů filtrování obsahu, seznamů blokovaných položek, transformace výzvy, přihlašovacích údajů k obsahu a dalších. Přečtěte si další informace o tom tady.

Všichni zákazníci můžou také nakonfigurovat filtry obsahu a vytvořit vlastní zásady zabezpečení, které jsou přizpůsobené požadavkům na případy použití. Funkce konfigurovatelnosti umožňuje zákazníkům upravit nastavení samostatně pro výzvy a dokončení a filtrovat obsah pro každou kategorii obsahu na různých úrovních závažnosti, jak je popsáno v následující tabulce. Obsah zjištěný na úrovni "bezpečné" závažnosti je označený v poznámkách, ale není předmětem filtrování a není konfigurovatelný.

Filtrovaná závažnost Konfigurovatelné pro výzvy Konfigurovatelné pro dokončení Popisy
Nízká, střední, vysoká Ano Yes Nejtěsnější konfigurace filtrování. Obsah zjištěný na úrovních závažnosti je nízký, střední a vysoký filtr.
Střední, vysoká Ano Yes Obsah zjištěný na úrovni závažnosti není filtrovaný, obsah na střední a vysoké úrovni se filtruje.
Vysoká Ano Yes Obsah zjištěný na úrovních závažnosti nízký a střední není filtrovaný. Filtruje se pouze obsah na úrovni závažnosti.
Žádné filtry Pokud schváleno1 Pokud schváleno1 Žádný obsah se nefiltruje bez ohledu na zjištěnou úroveň závažnosti. Vyžaduje schválení1.
Pouze přidávání poznámek Pokud schváleno1 Pokud schváleno1 Zakáže funkci filtru, takže obsah nebude blokovaný, ale prostřednictvím odpovědi rozhraní API se vrátí poznámky. Vyžaduje schválení1.

1 Pro modely Azure OpenAI mají plnou kontrolu nad filtrováním obsahu jenom zákazníci, kteří byli schváleni pro filtrování upraveného obsahu, a můžou vypnout filtry obsahu. Platí pro upravené filtry obsahu prostřednictvím tohoto formuláře: Azure OpenAI Limited Access Review: Upravené filtry obsahu. Pro zákazníky Azure Government platí pro upravené filtry obsahu prostřednictvím tohoto formuláře: Azure Government – Vyžádání upraveného filtrování obsahu pro službu Azure OpenAI.

Konfigurovatelné filtry obsahu pro vstupy (výzvy) a výstupy (dokončení) jsou k dispozici pro následující modely Azure OpenAI:

  • Řada modelů GPT
  • GPT-4 Turbo Vision GA* (turbo-2024-04-09)
  • GPT-4o
  • GPT-4o mini
  • DALL-E 2 a 3

Konfigurovatelné filtry obsahu nejsou k dispozici pro

  • o1-preview
  • o1-mini

*Dostupná pouze pro GPT-4 Turbo Vision GA, nevztahuje se na GPT-4 Turbo Vision Preview.

Konfigurace filtrování obsahu se vytvářejí v rámci prostředku na portálu Azure AI Foundry a dají se přidružit k nasazením. Další informace o možnosti konfigurace najdete tady.

Zákazníci zodpovídají za zajištění toho, aby aplikace integrující Azure OpenAI dodržovaly pravidla chování.

Vysvětlení dalších filtrů

Kromě výchozíchfiltrůch

Kategorie filtru Stav Výchozí nastavení Používá se k zobrazení výzvy nebo dokončení? Popis
Vyzvání štítů k přímým útokům (jailbreak) GA Zapnout Výzva uživatele Filtry / anotuje výzvy uživatelů, které můžou představovat riziko jailbreaku. Další informace o anotacích najdete v tématu Filtrování obsahu Azure AI Foundry.
Vyzvání štítů k nepřímým útokům GA Vypnout Výzva uživatele Filtrování nebo přidávání poznámek k nepřímým útokům, označovaným také jako útoky nepřímých výzev nebo útoků prostřednictvím injektáže mezi doménovými výzvami, což je potenciální ohrožení zabezpečení, kde třetí strany umístí škodlivé instrukce do dokumentů, ke kterým může systém generující umělé inteligence přistupovat a zpracovávat je. Vyžaduje: vkládání a formátování dokumentu.
Chráněný materiál – kód GA Zapnout Dokončení Filtruje chráněný kód nebo získá ukázkové citace a informace o licencích v poznámkách pro fragmenty kódu, které odpovídají jakýmkoli veřejným zdrojům kódu využívajícím GitHub Copilot. Další informace o používání poznámek najdete v průvodci koncepty filtrování obsahu.
Chráněný materiál – text GA Zapnout Dokončení Identifikuje a blokuje zobrazení známého textového obsahu ve výstupu modelu (například text skladby, recepty a vybraný webový obsah).
Uzemnění* Preview Vypnout Dokončení Zjistí, jestli jsou textové odpovědi velkých jazykových modelů (LLM) uzemněny ve zdrojových materiálech poskytovaných uživateli. Neuzemněnost odkazuje na případy, kdy LLM vytváří informace, které nejsou faktické nebo nepřesné z toho, co bylo přítomno ve zdrojových materiálech. Vyžaduje: vkládání a formátování dokumentu.

Vytvoření filtru obsahu v Azure AI Foundry

Pro jakékoli nasazení modelu v Azure AI Foundry můžete přímo použít výchozí filtr obsahu, ale možná budete chtít mít větší kontrolu. Můžete například nastavit přísnější nebo lenientnější filtr nebo povolit pokročilejší funkce, jako jsou stínění výzvy a detekce chráněných materiálů.

Tip

Další informace o filtrování obsahu v projektu Azure AI Foundry najdete v tématu Filtrování obsahu Azure AI Foundry.

Pokud chcete vytvořit filtr obsahu, postupujte takto:

  1. Přejděte do Azure AI Foundry a přejděte do svého projektu. Pak v nabídce vlevo vyberte stránku Zabezpečení a zabezpečení a vyberte kartu Filtry obsahu.

    Snímek obrazovky s tlačítkem pro vytvoření nového filtru obsahu

  2. Vyberte + Vytvořit filtr obsahu.

  3. Na stránce Základní informace zadejte název konfigurace filtrování obsahu. Vyberte připojení, které chcete přidružit k filtru obsahu. Pak vyberte Další.

    Snímek obrazovky s možností vybrat nebo zadat základní informace, jako je název filtru při vytváření filtru obsahu

    Teď můžete nakonfigurovat vstupní filtry (pro výzvy uživatelů) a výstupní filtry (pro dokončení modelu).

  4. Na stránce Vstupní filtry můžete nastavit filtr pro vstupní výzvu. Pro první čtyři kategorie obsahu existují tři úrovně závažnosti, které jsou konfigurovatelné: Nízká, střední a vysoká. Pomocí posuvníků můžete nastavit prahovou hodnotu závažnosti, pokud zjistíte, že vaše aplikace nebo scénář použití vyžaduje jiné filtrování než výchozí hodnoty. Některé filtry, například Prompt Shields a Protected Material Detection, umožňují určit, jestli má model a/nebo blokovat obsah. Výběrem možnosti Přidat poznámky se spustí pouze příslušný model a vrátí se poznámky prostřednictvím odpovědi rozhraní API, ale nebude filtrovat obsah. Kromě poznámek můžete také blokovat obsah.

    Pokud byl váš případ použití schválen pro upravené filtry obsahu, získáte úplnou kontrolu nad konfigurací filtrování obsahu a můžete se rozhodnout, že filtrování částečně nebo úplně vypnete, nebo povolíte přidávání poznámek jenom pro kategorie poškození obsahu (násilí, nenávist, sexuální a sebepoškozování).

    Obsah se označí podle kategorie a zablokuje se podle nastavené prahové hodnoty. U kategorií násilí, nenávisti, sexuálního a sebepoškozování upravte posuvník tak, aby blokoval obsah vysoké, střední nebo nízké závažnosti.

    Snímek obrazovky vstupního filtru

  5. Na stránce Výstupní filtry můžete nakonfigurovat výstupní filtr, který se použije pro veškerý výstupní obsah vygenerovaný vaším modelem. Nakonfigurujte jednotlivé filtry jako předtím. Tato stránka také poskytuje možnost režimu streamování, která umožňuje filtrovat obsah téměř v reálném čase, protože je generován modelem, což snižuje latenci. Až budete hotovi, vyberte Další.

    Obsah bude anotován jednotlivými kategoriemi a zablokován podle prahové hodnoty. U násilného obsahu, obsahu nenávisti, sexuálního obsahu a kategorie obsahu sebepoškozování upravte prahovou hodnotu pro blokování škodlivého obsahu se stejnou nebo vyšší úrovní závažnosti.

    Snímek obrazovky s výstupním filtrem

  6. Volitelně můžete na stránce Nasazení přidružit filtr obsahu k nasazení. Pokud už vybrané nasazení obsahuje připojený filtr, musíte potvrdit, že ho chcete nahradit. Filtr obsahu můžete také přidružit k nasazení později. Vyberte Vytvořit.

    Snímek obrazovky s možností vybrat nasazení při vytváření filtru obsahu

    Konfigurace filtrování obsahu se vytvářejí na úrovni centra na portálu Azure AI Foundry. Další informace o konfigurovatelnosti najdete v dokumentaci ke službě Azure OpenAI.

  7. Na stránce Revize zkontrolujte nastavení a pak vyberte Vytvořit filtr.

Použití seznamu blokovaných položek jako filtru

Seznam blokovaných položek můžete použít buď jako vstupní nebo výstupní filtr, nebo obojí. Povolte možnost Blocklist na stránce vstupního filtru nebo výstupního filtru. V rozevíracím seznamu vyberte jeden nebo více seznamů blokovaných položek nebo použijte integrovaný seznam blokovaných vulgárních výrazů. Do stejného filtru můžete zkombinovat více seznamů blokovaných položek.

Použití filtru obsahu

Proces vytváření filtru umožňuje použít filtr na požadovaná nasazení. Filtry obsahu můžete také kdykoli změnit nebo odebrat z nasazení.

Pokud chcete použít filtr obsahu pro nasazení, postupujte takto:

  1. Přejděte do Azure AI Foundry a vyberte projekt.

  2. V levém podokně vyberte Modely a koncové body a zvolte jedno z vašich nasazení a pak vyberte Upravit.

    Snímek obrazovky s tlačítkem pro úpravu nasazení

  3. V okně nasazení aktualizace vyberte filtr obsahu, který chcete použít pro nasazení. Pak vyberte Uložit a zavřít.

    Snímek obrazovky s filtrem použít obsah

    V případě potřeby můžete také upravit a odstranit konfiguraci filtru obsahu. Před odstraněním konfigurace filtrování obsahu budete muset zrušit přiřazení a nahradit ji z jakéhokoli nasazení na kartě Nasazení .

Teď můžete přejít na dětské hřiště a otestovat, jestli filtr obsahu funguje podle očekávání.

Zpětná vazba k filtrování obsahu sestavy

Pokud dochází k problému s filtrováním obsahu, vyberte v horní části hřiště tlačítko Filtry zpětné vazby . Po odeslání výzvy se tato možnost povolí na dětském hřišti Obrázky, Chat a Dokončení.

Po zobrazení dialogového okna vyberte příslušný problém s filtrováním obsahu. Uveďte co nejvíce podrobností týkající se vašeho problému s filtrováním obsahu, například konkrétní výzvu a chybu filtrování obsahu, se kterou jste narazili. Nezahrnujte žádné soukromé ani citlivé informace.

Pokud potřebujete podporu, odešlete lístek podpory.

Dodržujte osvědčené postupy.

Doporučujeme informovat vaše rozhodnutí o konfiguraci filtrování obsahu prostřednictvím iterativní identifikace (například červeného týmového testování, zátěžového testování a analýzy) a procesu měření, který řeší potenciální škody, které jsou relevantní pro konkrétní model, aplikaci a nasazení. Po implementaci zmírnění rizik, jako je filtrování obsahu, opakujte měření a otestujte efektivitu. Doporučení a osvědčené postupy pro zodpovědnou AI pro Azure OpenAI, které jsou zakotveny v standardu Microsoft Responsible AI, najdete v přehledu zodpovědné umělé inteligence pro Azure OpenAI.