Udostępnij za pośrednictwem


Domyślne zasady bezpieczeństwa zawartości

Usługa Azure OpenAI Service obejmuje domyślne bezpieczeństwo stosowane do wszystkich modeli, z wyłączeniem interfejsu Azure OpenAI Whisper. Te konfiguracje zapewniają domyślnie środowisko odpowiedzialne, w tym modele filtrowania zawartości, listy zablokowanych, przekształcanie monitów, poświadczenia zawartości i inne.

Domyślne bezpieczeństwo ma na celu ograniczenie ryzyka, takiego jak nienawiść i sprawiedliwość, seksualna, przemoc, samookaleczenia, chroniona zawartość materialna i ataki z monitem o wstrzyknięcie przez użytkownika. Aby dowiedzieć się więcej na temat filtrowania zawartości, odwiedź naszą dokumentację opisującą kategorie i poziomy ważności tutaj.

Wszystkie zabezpieczenia można konfigurować. Aby dowiedzieć się więcej na temat możliwości konfigurowania, odwiedź naszą dokumentację dotyczącą konfigurowania filtrowania zawartości.

Modele tekstu: GPT-4, GPT-3.5

Modele tekstowe w usłudze Azure OpenAI Service mogą przyjmować i generować zarówno tekst, jak i kod. Te modele wykorzystują modele filtrowania zawartości tekstowej platformy Azure do wykrywania i zapobiegania szkodliwej zawartości. Ten system działa zarówno po wyświetleniu monitu, jak i zakończeniu.

Kategoria ryzyka Monit/zakończenie Próg ważności
Nienawiść i sprawiedliwość Monity i zakończenia Śred.
Przemoc Monity i zakończenia Śred.
Seksualny Monity i zakończenia Śred.
Samookaleczenia Monity i zakończenia Śred.
Atak polegający na wstrzyknięciu monitu użytkownika (Jailbreak) Polecenia Nie dotyczy
Materiał chroniony — tekst Uzupełnienia Nie dotyczy
Materiał chroniony — kod Uzupełnienia Nie dotyczy

Modele przetwarzania obrazów: GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2

GPT-4o i GPT-4 Turbo

Kategoria ryzyka Monit/zakończenie Próg ważności
Nienawiść i sprawiedliwość Monity i zakończenia Śred.
Przemoc Monity i zakończenia Śred.
Seksualny Monity i zakończenia Śred.
Samookaleczenia Monity i zakończenia Śred.
Identyfikacja osób i wnioskowania poufnych atrybutów Polecenia Nie dotyczy
Atak polegający na wstrzyknięciu monitu użytkownika (Jailbreak) Polecenia Nie dotyczy

DALL-E 3 i DALL-E 2

Kategoria ryzyka Monit/zakończenie Próg ważności
Nienawiść i sprawiedliwość Monity i zakończenia Niski
Przemoc Monity i zakończenia Niski
Seksualny Monity i zakończenia Niski
Samookaleczenia Monity i zakończenia Niski
Poświadczenia zawartości Uzupełnienia Nie dotyczy
Zwodnicze pokolenie kandydatów politycznych Polecenia Nie dotyczy
Przedstawianie osób publicznych Polecenia Nie dotyczy
Atak polegający na wstrzyknięciu monitu użytkownika (Jailbreak) Polecenia Nie dotyczy
Materiał chroniony — znaki sztuki i studia Polecenia Nie dotyczy
Wulgaryzmy Polecenia Nie dotyczy

Oprócz powyższych konfiguracji bezpieczeństwa usługa Azure OpenAI DALL-E jest również domyślnie wyposażona w transformację monitu. Ta transformacja odbywa się na wszystkich monitach o zwiększenie bezpieczeństwa oryginalnego monitu, w szczególności w kategoriach ryzyka różnorodności, zwodnicze pokolenie kandydatów politycznych, przedstawienie osób publicznych, materiałów chronionych i innych.