Categorie di danni e livelli di gravità
Ogni categoria di danni applicata dal servizio include anche una classificazione del livello di gravità. Il livello di gravità è destinato a indicare la gravità delle conseguenze della visualizzazione dei contenuti contrassegnati. Sia i contenuti di testi che quelli delle immagini usano lo stesso set di flag.
Categorie di danni
Categoria | Descrizione |
---|---|
Odio ed equità | I danni correlati all'odio e all'equità si riferiscono a qualsiasi contenuto che attacca o usa un linguaggio peggiorativo o discriminatorio in riferimento a una persona o a un gruppo di identità in base a determinati attributi differenzianti. Questi attributi includono, ma non si limitano a: razza, etnia, nazionalità, identità ed espressione di genere, orientamento sessuale, religione, stato di immigrazione, stato di abilità, aspetto personale e dimensioni del corpo. L'equità consiste nel garantire che i sistemi di intelligenza artificiale considerino equamente tutti i gruppi di persone senza contribuire alle disuguaglianze sociali esistenti. Come i discorsi di odio, i danni correlati all'equità dipendono dalla disparità di trattamento dei gruppi di identità. |
Sessuale | Il termine "sessuale" descrive il linguaggio relativo a organi anatomici e genitali, relazioni romantiche, atti rappresentati in termini erotici o affettuosi, gravidanza, atti fisici sessuali. Include anche gli atti rappresentati come un'aggressione o un atto sessuale violento e forzato contro la propria volontà, la prostituzione, la pornografia e l'abuso. |
Violenza | La violenza descrive il linguaggio relativo ad azioni fisiche volte a ferire, danneggiare o uccidere qualcuno o qualcosa. Include anche il linguaggio che descrive le armi, i fucili e le entità correlate, come i produttori, le associazioni, la legislazione e così via. |
Autolesionismo | L'autolesionismo descrive il linguaggio relativo ad azioni fisiche volte a ferire o danneggiare intenzionalmente il proprio corpo o a uccidersi. |
La classificazione può essere con etichetta multipla. Ad esempio, quando un campione di testo viene eseguito tramite il modello di moderazione del testo, può essere classificato sia come contenuto sessuale che violento.
Livelli di gravità
Ogni categoria di danni applicata dal servizio include anche una classificazione del livello di gravità. Il livello di gravità è destinato a indicare la gravità delle conseguenze della visualizzazione dei contenuti contrassegnati. La scala di gravità è compresa tra 0 e 7. Il modello di testo supporta sia la scala completa da 0 a 7 che quella ridotta di 0, 2, 4 e 6. La versione corrente del modello immagine supporta solo la scala ridotta.
Per altre informazioni sulle definizioni di gravità, vedere aka.ms/severity-levels.