Domyślne zasady bezpieczeństwa zawartości
Usługa Azure OpenAI Service obejmuje domyślne bezpieczeństwo stosowane do wszystkich modeli, z wyłączeniem interfejsu Azure OpenAI Whisper. Te konfiguracje zapewniają domyślnie środowisko odpowiedzialne, w tym modele filtrowania zawartości, listy zablokowanych, przekształcanie monitów, poświadczenia zawartości i inne.
Domyślne bezpieczeństwo ma na celu ograniczenie ryzyka, takiego jak nienawiść i sprawiedliwość, seksualna, przemoc, samookaleczenia, chroniona zawartość materialna i ataki z monitem o wstrzyknięcie przez użytkownika. Aby dowiedzieć się więcej na temat filtrowania zawartości, odwiedź naszą dokumentację opisującą kategorie i poziomy ważności tutaj.
Wszystkie zabezpieczenia można konfigurować. Aby dowiedzieć się więcej na temat możliwości konfigurowania, odwiedź naszą dokumentację dotyczącą konfigurowania filtrowania zawartości.
Modele tekstu: GPT-4, GPT-3.5
Modele tekstowe w usłudze Azure OpenAI Service mogą przyjmować i generować zarówno tekst, jak i kod. Te modele wykorzystują modele filtrowania zawartości tekstowej platformy Azure do wykrywania i zapobiegania szkodliwej zawartości. Ten system działa zarówno po wyświetleniu monitu, jak i zakończeniu.
Kategoria ryzyka | Monit/zakończenie | Próg ważności |
---|---|---|
Nienawiść i sprawiedliwość | Monity i zakończenia | Śred. |
Przemoc | Monity i zakończenia | Śred. |
Seksualny | Monity i zakończenia | Śred. |
Samookaleczenia | Monity i zakończenia | Śred. |
Atak polegający na wstrzyknięciu monitu użytkownika (Jailbreak) | Polecenia | Nie dotyczy |
Materiał chroniony — tekst | Uzupełnienia | Nie dotyczy |
Materiał chroniony — kod | Uzupełnienia | Nie dotyczy |
Modele przetwarzania obrazów: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2
GPT-4o i GPT-4 Turbo
Kategoria ryzyka | Monit/zakończenie | Próg ważności |
---|---|---|
Nienawiść i sprawiedliwość | Monity i zakończenia | Śred. |
Przemoc | Monity i zakończenia | Śred. |
Seksualny | Monity i zakończenia | Śred. |
Samookaleczenia | Monity i zakończenia | Śred. |
Identyfikacja osób i wnioskowania poufnych atrybutów | Polecenia | Nie dotyczy |
Atak polegający na wstrzyknięciu monitu użytkownika (Jailbreak) | Polecenia | Nie dotyczy |
DALL-E 3 i DALL-E 2
Kategoria ryzyka | Monit/zakończenie | Próg ważności |
---|---|---|
Nienawiść i sprawiedliwość | Monity i zakończenia | Niski |
Przemoc | Monity i zakończenia | Niski |
Seksualny | Monity i zakończenia | Niski |
Samookaleczenia | Monity i zakończenia | Niski |
Poświadczenia zawartości | Uzupełnienia | Nie dotyczy |
Zwodnicze pokolenie kandydatów politycznych | Polecenia | Nie dotyczy |
Przedstawianie osób publicznych | Polecenia | Nie dotyczy |
Atak polegający na wstrzyknięciu monitu użytkownika (Jailbreak) | Polecenia | Nie dotyczy |
Materiał chroniony — znaki sztuki i studia | Polecenia | Nie dotyczy |
Wulgaryzmy | Polecenia | Nie dotyczy |
Oprócz powyższych konfiguracji bezpieczeństwa usługa Azure OpenAI DALL-E jest również domyślnie wyposażona w transformację monitu. Ta transformacja odbywa się na wszystkich monitach o zwiększenie bezpieczeństwa oryginalnego monitu, w szczególności w kategoriach ryzyka różnorodności, zwodnicze pokolenie kandydatów politycznych, przedstawienie osób publicznych, materiałów chronionych i innych.