Condividi tramite


Categorie personalizzate (anteprima)

Azure AI Content Safety consente di creare e gestire categorie di contenuto personalizzate per la moderazione avanzata e il filtro corrispondenti ai criteri o ai casi d'uso specifici.

Tipi di personalizzazione

In questa sezione sono disponibili più metodi per definire e usare categorie personalizzate, dettagliate e confrontate.

API Funzionalità
API delle categorie personalizzate (standard) Usare un modello di Machine Learning personalizzabile per creare, ottenere, eseguire query ed eliminare una categoria personalizzata. In alternativa, elencare tutte le categorie personalizzate per altre attività di annotazione.
API delle categorie personalizzate (rapida) Usare un modello linguistico di grandi dimensioni (LLM) per apprendere rapidamente modelli di contenuto specifici negli eventi imprevisti dei contenuti emergenti.

API delle categorie personalizzate (standard)

L'API delle categorie personalizzate (standard) consente ai clienti di definire categorie specifiche per le proprie esigenze, fornire dati di esempio, eseguire il training di un modello di Machine Learning personalizzato e usarlo per classificare il nuovo contenuto in base alle categorie apprese.

Questo è il flusso di lavoro standard per la personalizzazione con i modelli di Machine Learning. A seconda della qualità dei dati di training, può raggiungere livelli di prestazioni molto buoni anche se il training del modello può richiedere fino a diverse ore.

Questa implementazione funziona sui contenuti di testo non su quelli di immagini.

API delle categorie personalizzate (rapida)

L'API di Categorie personalizzate (rapida) è progettata per essere più rapida e più flessibile rispetto al metodo standard. Questo metodo è pensato per esser usato per identificare, analizzare, contenere, eliminare e recuperare contenuto da eventi informatici associati a contenuti inappropriati o dannosi presenti sulle piattaforme online.

Un evento imprevisto può includere un set di modelli di contenuto emergenti (testo, immagine o altre modalità) che violano le linee guida della community Microsoft o i criteri e le aspettative dei clienti. Questi eventi imprevisti devono essere mitigati in modo rapido e accurato per evitare potenziali problemi al sito live o danni agli utenti e alla community.

Questa implementazione funziona sia sul contenuto di testo che sul contenuto dell'immagine.

Suggerimento

Un altro elemento da gestire con gli eventi imprevisti dei contenuti emergenti consiste nell'usare blocklist, ma ciò consente solo la corrispondenza esatta del testo e nessuna corrispondenza di immagini. L'API delle categorie personalizzate (rapida) offre le funzionalità avanzate seguenti:

  • Corrispondenza semantica del testo tramite la ricerca di incorporamento con un classificatore leggero
  • Corrispondenza delle immagini con un modello di rilevamento oggetti leggero e la ricerca di incorporamento.

Funzionamento

La funzionalità delle categorie personalizzate di Sicurezza dei contenuti di Azure AI usa un processo in più passaggi per la creazione, il training e l'uso di modelli di classificazione dei contenuti personalizzati. Ecco il flusso di lavoro:

Passaggio 1: Definizione e configurazione

Quando si definisce una categoria personalizzata, è necessario insegnare all'intelligenza artificiale il tipo di contenuto che si vuole identificare. Ciò implica specificare un nome di categoria chiaro e una definizione dettagliata che incapsula le caratteristiche del contenuto.

È quindi necessario raccoglie un set di dati bilanciato con esempi positivi e (facoltativamente) negativi per consentire all'intelligenza artificiale di apprendere le sfumature associate alla categoria. Questi dati devono essere rappresentativi della varietà di contenuti che il modello rileverà in uno scenario reale.

Passaggio 2: Training del modello

Dopo aver preparato il set di dati e definito le categorie, il servizio Sicurezza dei contenuti di Azure AI esegue il training di un nuovo modello di Machine Learning. Questo modello usa le definizioni e il set di dati caricato per eseguire l'aumento dei dati usando un modello linguistico di grandi dimensioni. Di conseguenza, il set di dati di training viene reso più grande e di qualità superiore. Durante il training, il modello di intelligenza artificiale analizza i dati e impara a distinguere tra contenuto allineato alla categoria e il contenuto specificato che non lo è.

Passaggio 3: Valutazione del modello

Dopo il training, è necessario valutare il modello per assicurarsi che soddisfi i requisiti di accuratezza. Testare il modello con il nuovo contenuto che non ha ancora ricevuto in precedenza. La fase di valutazione consente di identificare le potenziali modifiche necessarie per distribuire il modello in un ambiente di produzione.

Passaggio 4: Utilizzo del modello

Usare l'API analyzeCustomCategory per analizzare il contenuto del testo e determinare se corrisponde alla categoria personalizzata definita. Il servizio restituirà un valore booleano che indica se il contenuto è allineato alla categoria specificata

Limiti

Disponibilità nelle lingue

Le API delle categorie personalizzate supportano tutte le lingue supportate dalla moderazione del testo di Sicurezza dei contenuti. Vedere Supporto per la lingua.

Limitazioni relative all’input

Vedere la tabella seguente per le limitazioni relative all’input dell'API delle categorie personalizzate (standard):

Object Limitazione
Lingue supportate Solo inglese
Numero di categorie per utente 3
Numero di versioni per categoria 3
Numero di compilazioni simultanee (processi) per categoria 1
Operazioni di inferenza al secondo 5
Numero di esempi in una versione di categoria Esempi positivi (obbligatori): minimo 50, massimo 5.000
In totale (esempi negativi e positivi): 10.000
Non sono consentiti esempi duplicati.
Dimensioni del file di esempio massimo 128.000 byte
Lunghezza di un esempio di testo massimo 125.000 caratteri
Lunghezza di una definizione di categoria massimo 1.000 caratteri
Lunghezza di un nome categoria massimo 128 caratteri
Lunghezza di un URL BLOB massimo 500 caratteri

Aree di disponibilità

Per usare queste API di Sicurezza dei contenuti, è necessario creare la risorsa di Sicurezza dei contenuti di Azure AI nelle aree supportate. Vedere Disponibilità a livello di area.

Passaggio successivo

Seguire una guida pratica per usare le API di Sicurezza dei contenuti di Azure AI per creare categorie personalizzate.