Condividi tramite


Introduzione: Studio di Informazioni sui documenti

Questo contenuto si applica a:segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale)

Studio di Informazioni sui documenti è uno strumento online per esplorare, comprendere e integrare visivamente le funzionalità del servizio Document Intelligence Studio nelle applicazioni. È possibile iniziare esplorando i modelli già sottoposti a training con esempi o documenti personalizzati. È anche possibile creare progetti per creare modelli personalizzati e farvi riferimento nelle applicazioni usando Python SDK e altre guide di avvio rapido.

Prerequisiti per i nuovi utenti

Per usare Document Intelligence Studio, sono necessari gli asset e le impostazioni seguenti:

Suggerimento

Creare una risorsa Servizi di Azure AI se si prevede di accedere a più Servizi di Azure AI con un singolo endpoint/chiave. Solo per l'accesso a Informazioni sui documenti, creare una risorsa di Informazioni sui documenti. Si noti che sarà necessaria una risorsa di tipo servizio singolo se si intende usare l'autenticazione di Microsoft Entra.

Informazioni sui documenti supporta ora l'autenticazione del token AAD aggiuntiva all'autenticazione locale (basata su chiave) quando si accede alle risorse e agli account di archiviazione di Informazioni sui documenti. Assicurarsi di seguire le istruzioni seguenti per configurare i ruoli di accesso corretti, soprattutto se le risorse vengono applicate con i criteri DisableLocalAuth.

  • Assegnazione dei ruoli di Azure definiti in modo adeguato Per l'analisi dei documenti e i modelli predefiniti, sono necessarie le assegnazioni di ruolo seguenti per scenari diversi.

    • Basic ✔️ Utente di Servizi cognitivi: è necessario questo ruolo per la risorsa Document Intelligence o Servizi di Azure AI per immettere la pagina di analisi.

    • Advanced ✔️ Collaboratore: è necessario questo ruolo per creare un gruppo di risorse, un servizio di Document Intelligence o una risorsa di Servizi di Azure AI.

      Per altre informazioni sull'autorizzazione, vedere Criteri di autorizzazione di Studio di Informazioni sui documenti.

      Nota

      Se l'autenticazione locale (basata su chiave) è disabilitata per la risorsa del servizio Informazioni sui documenti, assicurarsi di ottenere il ruolo utente di Servizi cognitivi e il token AAD verrà usato per autenticare le richieste in Studio di Informazioni sui documenti. Il ruolo Collaboratore consente solo di elencare le chiavi, ma non di concedere l'autorizzazione per usare la risorsa quando l'accesso alla chiave è disabilitato.

  • Dopo aver configurato la risorsa, è possibile provare i diversi modelli offerti da Document Intelligence Studio. Nella pagina iniziale selezionare un modello di Document Intelligence da provare a usare con un approccio senza codice.

  • Per testare uno dei modelli predefiniti o di analisi dei documenti, selezionare il modello e usare uno dei documenti di esempio o caricare il proprio documento da analizzare. Il risultato dell'analisi viene visualizzato a destra nella finestra content-result-code.

  • I modelli personalizzati devono essere sottoposti a training sui documenti. Per una panoramica dei modelli personalizzati, vedere panoramica dei modelli personalizzati.

Autenticazione

Passare a Document Intelligence Studio. Se è la prima volta che si esegue l'accesso, viene visualizzata una finestra popup che richiede di configurare la risorsa del servizio. In conformità ai criteri dell'organizzazione, sono disponibili una o due opzioni:

  • Autenticazione di Microsoft Entra: accesso tramite risorsa (scelta consigliata).

    • Scegliere la sottoscrizione esistente.

    • Selezionare un gruppo di risorse esistente all'interno della sottoscrizione o crearne uno nuovo.

    • Selezionare la risorsa esistente di Document Intelligence o dei Servizi di Azure AI.

      Screenshot del modulo di configurazione della risorsa del servizio da Document Intelligence Studio.

  • Autenticazione locale: accesso tramitechiave ed endpoint API.

    • Recuperare l'endpoint e la chiave dal portale di Azure.

    • Passare alla pagina di panoramica per la risorsa e selezionare Chiavi ed endpoint dalla barra di spostamento a sinistra.

    • Immettere i valori nei campi appropriati.

      Screenshot della pagina chiavi ed endpoint nel portale di Azure.

  • Dopo aver convalidato lo scenario in Document Intelligence Studio, utilizzare le librerie client C#, Java, JavaScript o Python o l'API REST per iniziare a incorporare i modelli di Document Intelligence nelle proprie applicazioni.

Per altre informazioni su ogni modello, vedere le pagine del concetto.

Visualizza i dettagli delle risorse

Per visualizzare i dettagli delle risorse, ad esempio nome e piano tariffario, selezionare l'icona Impostazioni nell'angolo in alto a destra della home page di Document Intelligence Studio e selezionare la scheda Risorsa. Se si ha accesso ad altre risorse, è anche possibile cambiare risorsa.

Aggiunta di prerequisiti per i progetti personalizzati

Oltre all'account Azure e a una risorsa di Informazioni sui documenti o ai Servizi di Azure AI, è necessario:

Contenitore dell'archiviazione BLOB di Azure

Un account di Archiviazione BLOB di Azure con prestazioni standard. Si creano contenitori per archiviare e organizzare i documenti di training all'interno dell'account di archiviazione. Se non si sa come creare un account di archiviazione di Azure con un contenitore, seguire queste guide di avvio rapido:

  • Creare un account di archiviazione. Durante la creazione dell'account di archiviazione, assicurarsi di selezionare le prestazioni Standard nel campo Dettagli istanza → Prestazioni.
  • Creare un contenitore. Quando si crea il contenitore, impostare il campo Livello di accesso pubblico su Contenitore (accesso in lettura anonimo per contenitori e BLOB) nella finestra Nuovo contenitore.

Assegnazioni di ruolo di Azure

Per i progetti personalizzati, per diversi scenari sono necessarie le assegnazioni di ruolo seguenti.

  • Di base

    • Utente di Servizi cognitivi: è necessario questo ruolo per la risorsa di Servizi di Azure AI o Informazioni sui documenti per eseguire il training del modello personalizzato o eseguire l'analisi con i modelli sottoposti a training.
    • Collaboratore ai dati dei BLOB di archiviazione: è necessario questo ruolo per l'account di archiviazione per creare un progetto ed etichettare i dati.
  • Avanzato

    • Collaboratore account di archiviazione: è necessario questo ruolo per l'account di archiviazione per configurare le impostazioni CORS. Questa azione è un'operazione una tantum se lo stesso account di archiviazione viene riutilizzato.
    • Collaboratore: è necessario questo ruolo per creare un gruppo di risorse e risorse.

    Nota

    Se l'autenticazione locale (basata su chiave) è disabilitata per la risorsa del servizio Informazioni sui documenti e l'account di archiviazione, assicurarsi di ottenere rispettivamente i ruoli Utente di Servizi cognitivi e Collaboratore dati BLOB, quindi si dispone di autorizzazioni sufficienti per usare Studio di Informazioni sui documenti. I ruoli Collaboratore account di archiviazione e Collaboratore consentono solo di elencare le chiavi, ma non di concedere l'autorizzazione per usare le risorse quando l'accesso alla chiave è disabilitato.

Configurare CORS

È necessario che Condivisione di risorse tra le origini (CORS) sia configurato nell'account di archiviazione di Azure affinché sia accessibile da Studio di Informazioni sui documenti. Per configurare CORS nel portale di Azure, è necessario accedere alla scheda CORS dell'account di archiviazione.

  1. Selezionare la scheda CORS per l'account di archiviazione.

    Screenshot del menu delle impostazioni CORS nel portale di Azure.

  2. Per iniziare, creare una nuova voce CORS nel servizio BLOB.

  3. Impostare Origini consentite su https://documentintelligence.ai.azure.com.

    Screenshot che mostra la configurazione CORS per un account di archiviazione.

    Suggerimento

    È possibile utilizzare il carattere jolly '*' anziché un dominio specificato per consentire a tutti i domini di origine di effettuare richieste tramite CORS.

  4. Selezionare tutte le 8 opzioni disponibili per Metodi consentiti.

  5. Approvare tutte le Intestazioni consentite e le Intestazioni esposte immettendo un * in ogni campo.

  6. Impostare la Validità massima su 120 secondi o su qualsiasi valore accettabile.

  7. Selezionare il pulsante Salva nella parte superiore della pagina per salvare le modifiche.

CORS dovrebbe ora essere configurato per l'uso dell'account di archiviazione da Studio di Informazioni sui documenti.

Set di documenti di esempio

  1. Accedere al portale di Azure e passare a Account di archiviazione personale>Archiviazione dati>Contenitori.

    Screenshot del menu Archiviazione dati nel portale di Azure.

  2. Selezionare un contenitore dall'elenco.

  3. Selezionare Carica dal menu nella parte superiore della pagina.

    Screenshot del pulsante di caricamento del contenitore nel portale di Azure.

  4. Verrà visualizzata la finestra Carica BLOB.

  5. Selezionare i file da caricare.

    Screenshot della finestra del BLOB di caricamento nel portale di Azure.

Nota

Per impostazione predefinita, Studio userà i documenti che si trovano nella radice del contenitore. È tuttavia possibile usare i dati organizzati in cartelle specificando il percorso della cartella nei passaggi di creazione del progetto del modulo personalizzato. Vedere Organizzare i dati in sottocartelle

Usare le funzionalità di Document Intelligence Studio

I documenti di etichettatura automatica con modelli predefiniti o uno dei propri modelli

  • Nella pagina di etichettatura del modello di estrazione personalizzata è ora possibile etichettare automaticamente i documenti usando uno dei modelli predefiniti del servizio Document Intelligent o i modelli sottoposti a training.

    Screenshot animato che mostra l'etichettatura automatica in Studio.

  • Per alcuni documenti, potrebbero verificarsi etichette duplicate dopo l'esecuzione dell'etichetta automatica. Assicurarsi di modificare le etichette in modo che non siano presenti etichette duplicate nella pagina di etichettatura in un secondo momento.

    Screenshot che mostra l'avviso di etichetta duplicato dopo l'etichettatura automatica.

Tabelle con etichette automatiche

  • Nella pagina di etichettatura del modello di estrazione personalizzata è ora possibile etichettare automaticamente le tabelle nel documento senza dover etichettare manualmente le tabelle.

    Screenshot animato che mostra l'etichettatura automatica delle tabelle in Studio.

Aggiungere file di test direttamente al set di dati di training

  • Dopo aver eseguito il training di un modello di estrazione personalizzato, usare la pagina di test per migliorare la qualità del modello caricando i documenti di test nel set di dati di training, se necessario.

  • Se per alcune etichette viene restituito un punteggio di attendibilità basso, assicurarsi che il contenuto sia stato etichettato correttamente. In caso contrario, aggiungerli al set di dati di training e etichettare nuovamente per migliorare la qualità del modello.

    Screenshot animato che mostra come aggiungere file di test al set di dati di training.

Utilizzare le opzioni e i filtri dell'elenco di documenti nei progetti personalizzati

  • Usare la pagina di etichettatura del modello di estrazione personalizzata per spostarsi tra i documenti di training, semplificando l'uso della funzionalità di ricerca, filtro e ordinamento.

  • Utilizzare la visualizzazione griglia per vedere in anteprima i documenti o usare la visualizzazione elenco per scorrere i documenti più facilmente.

    Screenshot delle opzioni di visualizzazione elenco dei documenti e dei filtri.

Condivisione di progetti

Condividere facilmente progetti di estrazione personalizzati. Per altre informazioni, vedere Condivisione di progetti con modelli personalizzati.

Passaggi successivi

Introduzione a Studio di Informazioni sui documenti.