Per iniziare con i classificatori sottoponibili a training

Articolo
12/18/2024

Un classificatore sottoponibile a training di Microsoft Purview è uno strumento che è possibile eseguire il training per riconoscere vari tipi di contenuto fornendogli esempi da esaminare. Dopo il training, è possibile usarlo per identificare l'elemento per l'applicazione delle etichette di riservatezza di Office, dei criteri di conformità delle comunicazioni e dei criteri delle etichette di conservazione.

Per implementare un classificatore sottoponibile a training personalizzato sono necessari due passaggi:

Fornire due set di dati di esempio (selezionati dagli esseri umani).
1. Set che contiene solo gli elementi che appartengono alla categoria.
2. Set che contiene solo gli elementi che non appartengono alla categoria.
Testare la capacità del classificatore di rilevare le corrispondenze.

Questo articolo illustra come creare e testare un classificatore personalizzato.

Per altre informazioni sui diversi tipi di classificatori, vedere Informazioni sui classificatori sottoponibili a training.

Consiglio

Se non si è cliente E5, usa la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione di Microsoft Purview. Informazioni dettagliate sui termini di registrazione e prova.

Prerequisiti

Requisiti di licenza

I classificatori sono una funzionalità in conformità Microsoft 365 E3 ed E5. È necessario disporre di una di queste sottoscrizioni per usarle.

Autorizzazioni

Per usare classificatori negli scenari seguenti, sono necessarie le autorizzazioni seguenti:

Scenario	Autorizzazioni del ruolo necessarie
Criteri delle etichette di conservazione	Gestione record Gestione conservazione
Criteri delle etichette di riservatezza	Amministratore della sicurezza Amministratore di conformità Amministratore dati di conformità
Criteri di conformità delle comunicazioni	Amministratore della gestione dei rischi Insider Amministratore revisione supervisione

Importante

Per impostazione predefinita, solo l'utente che crea un classificatore personalizzato può eseguire il training e la revisione delle stime effettuate da tale classificatore.

Preparare un classificatore sottoponibile a training personalizzato

È utile comprendere cosa comporta la creazione di un classificatore sottoponibile a training personalizzato prima di iniziare.

Flusso di lavoro complessivo

Per altre informazioni sul flusso di lavoro complessivo della creazione di classificatori sottoponibili a training personalizzati, vedere il flusso di processo per la creazione di classificatori sottoponibili a training personalizzati.

Contenuto di inizializzazione

Per assicurarsi che il classificatore sottoponibile al training possa identificare in modo indipendente e accurato che un elemento appartiene a una particolare categoria di contenuto, è necessario presentarlo con molti esempi del tipo di contenuto incluso nella categoria. Questa alimentazione dei campioni al classificatore sottoponibile al training è nota come seeding. Un essere umano deve essere quello che deve selezionare il contenuto di inizializzazione e tale contenuto deve includere due set di dati: uno contenente solo elementi che rappresentano fortemente il contenuto che il classificatore è progettato per rilevare (esempi positivi) e un secondo set di elementi che chiaramente non appartengono (esempi negativi).

Per eseguire il training di un classificatore sono necessari almeno 50 campioni positivi (fino a 500) e almeno 150 campioni negativi (fino a 1500). Più esempi vengono forniti, più accurate saranno le stime che il classificatore effettua. Il classificatore sottoponibile a training elabora fino agli esempi creati più di recente nel 2000 (in base al timestamp di data/ora creato dal file).

Consiglio

Per ottenere risultati ottimali, nel set di esempi di test sono presenti almeno 200 elementi che includono almeno 50 esempi positivi e almeno 150 esempi negativi.

Come creare un classificatore sottoponibile a training

Selezionare la scheda appropriata per il portale in uso. A seconda del piano di Microsoft 365, il Portale di conformità di Microsoft Purview viene ritirato o verrà ritirato a breve.

Per altre informazioni sul portale di Microsoft Purview, vedere Portale di Microsoft Purview. Per altre informazioni sul portale di conformità, vedere Portale di conformità di Microsoft Purview.

In anteprima: Il processo seguente automatizza il test dei classificatori sottoponibili a training e riduce il flusso di lavoro di creazione da 12 giorni a due giorni. In alcuni casi, il processo può richiedere solo poche ore.

Raccogliere tra 50-500 elementi di contenuto di inizializzazione che rappresentano fortemente i dati che il classificatore deve identificare positivamente come inclusi nella categoria. Per un elenco dei tipi di file supportati, vedere Default crawled file name extensions and parsed file types in SharePoint Server .For a list of supported file types, see Default crawled file name extensions and parsed file types in SharePoint Server.For a list of supported file types, see Default crawled file name extensions and parsed file types in SharePoint Server.
Raccogliere un secondo set di contenuto di inizializzazione (da 150 a 1500 elementi) che rappresenta i dati che non appartengono alla categoria.
Inserire il contenuto di inizializzazione positivo e negativo in cartelle di SharePoint separate. Ogni cartella deve essere dedicata a contenere solo il contenuto di inizializzazione. Prendere nota dell'URL del sito, della raccolta e della cartella per ogni set.

Consiglio

Se si crea un nuovo sito e una nuova cartella di SharePoint per i dati di inizializzazione, consentire almeno un'ora per l'indicizzazione di tale percorso prima di creare il classificatore sottoponibile al training che userà i dati di inizializzazione.
Accedere al portale di Microsoft Purview o al Portale di conformità di Microsoft Purview con l'accesso al ruolo amministratore di conformità o sicurezza e passare a Prevenzione della perdita> dei datiClassificatori diclassificazione> dei dati.
Scegliere la scheda Classificatori sottoponibili a training .
Scegliere Crea classificatore sottoponibile a training.
Aggiungere l'origine degli esempi positivi : selezionare il sito di SharePoint, la raccolta e l'URL della cartella per il contenuto di inizializzazione che deve essere rilevato dal classificatore e quindi scegliere Avanti.
Aggiungere l'origine degli esempi negativi : selezionare il sito di SharePoint, la raccolta e l'URL della cartella per il contenuto di inizializzazione che deve essere ignorato dal classificatore e quindi scegliere Avanti.
Esaminare le impostazioni e scegliere Crea classificatore sottoponibile a training.
Entro 24 ore o meno, il classificatore sottoponibile al training elabora i dati di inizializzazione e compila un modello di stima. Lo stato del classificatore è In corso durante l'elaborazione dei dati di inizializzazione. Al termine dell'elaborazione dei dati di inizializzazione, il classificatore cambia in Training e gli elementi sono stati testati.
Una volta completato il training e gli elementi sono stati testati (automaticamente), pubblicare il classificatore scegliendo Pubblica per l'uso.

Dopo la pubblicazione, il classificatore è disponibile come condizione nell'etichettatura automatica di Office con etichette di riservatezza, nell'applicazione automatica dei criteri delle etichette di conservazione in base a una condizione e in Conformità delle comunicazioni.

Testare il classificatore

Dopo che il classificatore sottoponibile al training elabora campioni positivi e negativi sufficienti per compilare un modello di stima, è necessario testare le stime che esegue. Durante il test del classificatore, verificare se le stime sono corrette. Dopo l'elaborazione di tutti i dati, esaminare i risultati manualmente e verificare se ogni stima è corretta, errata o non si è sicuri. Microsoft usa questo feedback in aggregazione per migliorare il modello di stima.

Condividi tramite