Domande frequenti

Questo contenuto si applica a:segno di spuntav4.0 (GA) segno di spunta v3.1 (GA) v3.0 (GA)segno di spuntasegno di spuntav2.1 (GA)

Informazioni sui documenti di Azure AI è un servizio basato sul cloud che usa modelli di apprendimento automatico per estrarre coppie chiave-valore, testo e tabelle dai documenti. Il risultato restituito è un output JSON strutturato. I casi d'uso di Informazioni sui documenti includono l'elaborazione automatica dei dati, le strategie avanzate basate sui dati e le funzionalità di ricerca dei documenti arricchite.

Panoramica

Informazioni sui documenti di Azure AI e Riconoscimento modulo di Azure AI sono lo stesso servizio?

.

Informazioni sui documenti di Azure AI e Riconoscimento modulo di Azure AI sono lo stesso servizio. Il servizio è stato rinominato da Riconoscimento modulo di Azure AI in Informazioni sui documenti di Azure AI nel luglio 2023. Il servizio offre le stesse funzioni e funzionalità di prima della ridenominazione.

  • Modifiche ai prezzi: non sono state apportate modifiche ai prezzi. I nomi Servizi cognitivi e Servizi di intelligenza artificiale applicata di Azure continuano a essere usati nelle API di fatturazione, analisi dei costi, listini prezzi e prezzi di Azure.

  • Modifiche di rilievo: non sono state apportate modifiche di rilievo alle API o alle librerie client.

Informazioni sui documenti si integra con altri servizi Microsoft?

.

Informazioni sui documenti si integra con i servizi seguenti:

Funzionalità di intelligenza artificiale

È possibile usare Informazioni sui documenti con l’intelligenza artificiale generativa per l'elaborazione dei documenti?

.

È possibile anche usare una soluzione di intelligenza artificiale generativa di documenti per chattare con i documenti, generare contenuti accattivanti da tali documenti e accedere ai modelli del servizio Azure OpenAI sui dati.

  • L’uso combinato di Informazioni sui documenti di Azure AI e Azure OpenAI permette di creare un’applicazione aziendale per interagire facilmente con i documenti utilizzando il linguaggio naturale. È possibile trovare facilmente risposte, ottenere informazioni dettagliate preziose e generare contenuti nuovi e coinvolgenti dai documenti esistenti.

  • Per altre informazioni sul modello di generazione aumentata di recupero, vedere qui.

Informazioni sui documenti può essere utile per suddividere in blocchi semantici all'interno dei documenti per la generazione aumentata del recupero?

.

Informazioni sui documenti è in grado di fornire blocchi predefiniti per abilitare la suddivisione in blocchi semantici. La suddivisione in blocchi semantici è un passaggio chiave nella generazione di recupero aumentata (RAG) per garantire blocchi densi del contesto e il miglioramento della pertinenza.

  • Informazioni sui documenti fornisce un modello di layout che offre una scomposizione visiva del documento in righe, paragrafi, sezioni, intestazioni e piè di pagina.

  • È quindi possibile scegliere di recuperare i risultati in formato markdown per suddividere ulteriormente il documento sui limiti di sezione o paragrafo.

Per altre informazioni, vedere Panoramica di RAG di Informazioni sui documenti

Document Intelligence Studio

Sono necessarie specifiche autorizzazioni per accedere a Studio di Informazioni sui documenti?

.

Per accedere a Studio di Informazioni sui documenti , è necessario disporre di un account e una sottoscrizione di Azure attivi con almeno un ruolo di lettore.

Per l'analisi dei documenti e i modelli predefiniti, ecco i requisiti dei ruoli per gli scenari utente:

Per i progetti di modello personalizzati, ecco i requisiti dei ruoli per gli scenari utente:

  • Di base

    • Utente di Servizi cognitivi: questo ruolo è necessario per una risorsa di Informazioni sui documenti o Servizio multiplo di Servizi cognitivi di Azure per eseguire il training di un modello personalizzato o analizzare i modelli sottoposti a training.

    • Collaboratore ai dati dei BLOB di archiviazione: è necessario questo ruolo per un account di archiviazione per creare un progetto ed etichettare i dati.

  • Avanzato

    • Collaboratore account di archiviazione: è necessario questo ruolo per consentire all'account di archiviazione di configurare le impostazioni CORS (cross-origin resource sharing). Si tratta di un impegno monouso se si riutilizza lo stesso account di archiviazione.

    • Collaboratore: è necessario questo ruolo per creare un gruppo di risorse e risorse. Il ruolo Collaboratore o Collaboratore account di archiviazione non consente di accedere all'uso della risorsa di Informazioni sui documenti o dell'account di archiviazione se l'autenticazione locale (basata su chiave) è disabilitata. Per usare le funzioni in Studio di Informazioni sui documenti, sono ancora necessari i ruoli di base (Utente di Servizi cognitivi e Contributore BLOB dati di archiviazione).

Per altre informazioni, vedere Ruoli predefiniti di Microsoft Entra e le sezioni sulle assegnazioni di ruolo di Azure nell'avvio rapido di Studio di Informazioni sui documenti.

È possibile elaborare documenti con più di due pagine in Studio di Informazioni sui documenti?

, per le risorse del livello a pagamento.

No, per le risorse del livello gratuito.

  • Per le risorse del livello gratuito (F0), vengono analizzate solo le prime due pagine se si usano Studio di Informazioni sui documenti, l'API REST o le librerie client.

  • Per analizzare tutte le pagine di un documento, passare a una risorsa a pagamento (S0). In Studio di Informazioni sui documenti selezionare il pulsante Impostazioni (ingranaggio), selezionare la scheda Risorse e controllare il piano tariffario usato per analizzare i documenti.

È possibile modificare directory o sottoscrizioni in Studio di Informazioni sui documenti?

.

  • Per modificare una directory in Studio di Informazioni sui documenti, selezionare il pulsante Impostazioni (ingranaggio). In Directoryselezionare la directory dall'elenco e quindi selezionare Cambia directory. Dopo aver cambiato la directory eseguire di nuovo l'accesso.

  • Per modificare una sottoscrizione o una risorsa, passare alla scheda Risorsa in Impostazioni.

È possibile usare Studio di Informazioni sui documenti con una risorsa configurata con un firewall o una rete virtuale?

.

Per v4.0 11-30-2024 (GA), l'etichettatura automatica è ospitata in modo nativo con il resto del servizio, quindi non è necessario consentire l'elenco di indirizzi IP. Per qualsiasi versione precedente, se la risorsa di Document Intelligence è configurata con un firewall o una rete virtuale, è necessario aggiungere l'indirizzo IP dedicato 20.3.165.95 all'elenco degli elementi consentiti del firewall per la risorsa di Document Intelligence. Alcune funzioni nei progetti personalizzati (ad esempio, l'etichetta automatica, la gestione dei progetti e l'utente nel ciclo) non funzionano se l'accesso alla rete pubblica è disabilitato.

Quando si carica un file in Document Intelligence Studio tramite la funzione "Recupera dall'URL", è possibile usare un URL dall'archivio BLOB?

.

Se l'URL dell'archiviazione BLOB di Azure include un token di firma di accesso condiviso ed è accessibile dalle reti pubbliche. Non è possibile usare la funzione Fetch per gli account di archiviazione in cui l'accesso alla chiave è disabilitato o dietro un firewall o una rete virtuale.

È possibile riutilizzare o personalizzare l'esperienza di etichettatura da Studio di Informazioni sui documenti e compilarla nella propria applicazione?

.

L'esperienza di etichettatura di Studio di Informazioni sui documenti è open source nel repository Toolkit.

Esistono endpoint URL separati per le aree cloud sovrane di Informazioni sui documenti?

.

Studio di Informazioni sui documenti include endpoint URL separati per le aree cloud sovrane:

Sviluppo di app

È possibile sviluppare applicazioni usando Informazioni sui documenti di Azure AI e le opzioni di sviluppo più recenti?

.

Informazioni sui documenti offre le opzioni di sviluppo più recenti all'interno delle piattaforme seguenti:

È possibile eseguire la migrazione dell'applicazione alla versione più recente di Informazioni sui documenti?

.

Questa tabella fornisce collegamenti a istruzioni dettagliate per la migrazione alla versione più recente di Informazioni sui documenti:

Lingua/API Guida alla migrazione
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

È possibile specificare un intervallo di pagine da analizzare in un documento?

.

Usare il parametro pages (supportato in v2.1, v3.0 e versioni successive dell'API REST) e specificare le pagine per documenti PDF e TIFF a più pagine. L'input accettato include gli intervalli seguenti:

  • Pagine singole. Ad esempio, se si specifica 1, 2, vengono elaborate le pagine 1 e 2.
  • Intervalli finiti. Ad esempio, se si specifica 2-5, vengono elaborate le pagine da 2 a 5.
  • Intervalli aperti. Ad esempio, se si specifica 5-, vengono elaborate tutte le pagine a partire dalla pagina 5. Se si specifica -10, vengono elaborate le pagine da 1 a 10.

È possibile combinare questi parametri e gli intervalli possono sovrapporsi. Ad esempio, se si specifica -5, 1, 3, 5-10, vengono elaborate le pagine da 1 a 10.

Il servizio accetta la richiesta se può elaborare almeno una pagina del documento. Ad esempio, l'utilizzo di 5-100 in un documento di cinque pagine è un input valido che significa che elaborata la pagina 5.

Se non si specifica un intervallo di pagine, viene elaborato l'intero documento.

È consigliabile usare Studio di Informazioni sui documenti anziché lo strumento di etichettatura di esempio FOTT per il progetto?

.

Nella maggior parte dei casi, è consigliabile usare Studio di Informazioni sui documenti perché può ridurre il tempo necessario per la configurazione delle risorse di Informazioni sui documenti e dei servizi di archiviazione.

Prendere in considerazione l'uso di Form OCR Testing Tool (FOTT) solo per gli scenari seguenti:

Quali sono le procedure consigliate per attenuare la limitazione delle richieste?

.

Informazioni sui documenti usa la scalabilità automatica per fornire le risorse di calcolo necessarie su richiesta, mantenendo al contempo bassi i costi dei clienti. Per ridurre la limitazione delle richieste durante la scalabilità automatica, è consigliabile adottare l'approccio seguente:

  • Implementare la logica di ripetizione dei tentativi nell'applicazione.

  • Se si rileva una limitazione al numero di richieste POST, è consigliabile aggiungere un ritardo tra le richieste.

  • Aumentare gradualmente il carico di lavoro. Evitare modifiche drastiche.

  • Creare una richiesta di supporto per aumentare il limite di transazioni al secondo (TPS).

Altre informazioni su quote e limiti del servizio Informazioni sui documenti.

Modelli personalizzati

È possibile migliorare un punteggio di accuratezza stimato per un modello personalizzato?

.

Le variazioni nella struttura visiva dei documenti possono influenzare l'accuratezza di un modello. Di seguito sono riportati alcuni suggerimenti:

  • Includere tutte le varianti di un documento nel set di dati di training. Le varianti includono formati diversi, ad esempio PDF digitali e PDF digitalizzati.

  • Separare i tipi di documenti visivamente distinti ed eseguire il training di modelli diversi.

  • Assicurarsi che non vi siano etichette estranee.

  • Per l'etichettatura della firma e dell'area, non includere il testo circostante.

Per altre informazioni, vedere Accuratezza e punteggi di attendibilità.

È possibile ripetere il training di un modello personalizzato?

Nr.

  • Informazioni sui documenti non dispone di un'operazione di ripetizione esplicita del training. Ogni operazione di training genera un nuovo modello.

  • Se si ritiene che il modello necessiti di una ripetizione del training, è possibile aggiungere altri esempi al set di dati di training ed eseguire il training di un nuovo modello.

  • È anche possibile creare un nuovo modello per la composizione con il modello originale come indicato di seguito:

    1. Creare un set di dati per il nuovo modello.

    2. Etichettare ed eseguire il training di un nuovo modello.

    3. Verificare che il nuovo modello funzioni correttamente per i tipi di documento specifici.

    4. Comporre il nuovo modello con il modello esistente in un singolo endpoint. Informazioni sui documenti può quindi determinare il modello migliore per ogni documento da analizzare.

    Per altre informazioni, vedere Modelli composti.

È possibile spostare i modelli sottoposti a training da un ambiente (ad esempio beta) a un altro (ad esempio produzione)?

.

È possibile usare l'API di copia per copiare modelli personalizzati da un account di Informazioni sui documenti in altri account presenti in qualsiasi area geografica supportata. Per istruzioni dettagliate, vedere Ripristino di emergenza.

L'operazione di copia è limitata alla copia dei modelli all'interno dell'ambiente cloud specifico in cui è stato eseguito il training del modello. Ad esempio, la copia di modelli dal cloud pubblico ad Azure per enti pubblici non è supportata.

Viene addebitato un addebito quando si usa l'etichettatura automatica?

Sì. L'etichetta automatica comporta un costo equivalente a una richiesta di analisi per il modello corrispondente per un documento.

Si riceve un addebito quando si esegue il training di modelli personalizzati?

.

Per v4.0 11-30-2024 (GA) i modelli neurali personalizzati è possibile eseguire il training gratuito per un massimo di 10 ore. Se si esegue il training di un singolo modello per le 10 ore o si esegue il training di più modelli per il totale di 10 ore, non vengono addebitati i costi per le prime 10 ore. Dopo aver usato le 10 ore gratuite, l'ora di training aggiuntiva viene addebitata automaticamente. Per informazioni dettagliate sui prezzi, vedere la pagina dei prezzi. Questa nuova funzionalità di training a pagamento consente ai modelli di training con durata estesa di elaborare documenti di dimensioni maggiori. Per altre informazioni su questa funzionalità di training a pagamento, vedere la sezione di fatturazione del modello neurale personalizzato.

Per v3.0 2022-08-31 o v3.1 2023-07-31, è possibile eseguire il training gratuito dei modelli neurali personalizzati per un massimo di 20 sessioni di training, con ogni sessione limitata a 30 minuti di durata. Dopo aver usato tutte le 20 sessioni di training, è possibile inviare un ticket di supporto di Azure per aumentare il limite di sessioni di training. Per aumentare il limite, due sessioni di training vengono considerate come un'ora di training e vengono addebitati i costi per due sessioni/un'ora di training. Per informazioni dettagliate sui prezzi, vedere la pagina dei prezzi. Per altre informazioni su come aumentare il limite, vedere la sezione di fatturazione del modello neurale personalizzato. Per v3.0 e v3.1, la funzionalità di training a pagamento non è disponibile. La funzionalità di training a pagamento per il modello neurale personalizzato è disponibile solo in v4.0.

Account di archiviazione

Esiste una scadenza per il token di firma di accesso condiviso (SAS) per l'autenticazione dell'account di archiviazione?

.

Quando si crea una firma di accesso condiviso, la durata predefinita è di 48 ore. Dopo 48 ore, è necessario creare un nuovo token.

Valutare la possibilità di impostare un periodo di durata più lungo per il tempo in cui si usa l'account di archiviazione con Informazioni sui documenti.

Informazioni sui documenti può accedere ai dati nell’account di archiviazione se si trova dietro una rete virtuale o un firewall?

No, non direttamente.

Se si dispone di un account di archiviazione di Azure protetto da una rete virtuale o da un firewall, Informazioni sui documenti non può accedere direttamente all'account di archiviazione.

Tuttavia, l'accesso e l'autenticazione dell'account di archiviazione di Azure privato supportano identità gestite per le risorse di Azure. Quando si usa un'identità gestita, il servizio Informazioni sui documenti può accedere all'account di archiviazione usando una credenziale assegnata.

Se si intende analizzare i dati dell'account di archiviazione privato usando FOTT, è necessario distribuire lo strumento dietro la rete virtuale o il firewall.

Informazioni su come creare e usare un'identità gestita per la risorsa di Informazioni sui documenti.

Contenitori

Esiste una differenza tra contenitore disconnesso e connesso?

.

Anche se le funzionalità del modello sono le stesse per i contenitori connessi e disconnessi, i metodi di fatturazione e connettività differiscono:

  • I contenitori connessi inviano informazioni di fatturazione ad Azure usando una risorsa di Informazioni sui documenti nell'account Azure. Con i contenitori connessi è necessaria la connettività Internet per inviare informazioni di fatturazione ad Azure. I contenitori connessi a Informazioni sui documenti inviano informazioni di fatturazione ad Azure usando una risorsa di Informazioni sui documenti nell'account Azure. I contenitori connessi non inviano a Microsoft i dati dei clienti, ad esempio l'immagine o il testo analizzato. Per un esempio delle informazioni inviate dai contenitori connessi a Microsoft per la fatturazione, vedere Domande frequenti sul contenitore di Intelligenza artificiale di Azure.

  • I contenitori disconnessi consentono di usare le API disconnesse da Internet. Le informazioni di fatturazione non vengono inviate tramite Internet. Invece, vengono invece addebitati i costi in base a un livello di impegno acquistato. Attualmente, l'utilizzo del contenitore disconnesso è disponibile per i modelli personalizzati e di fatture di Informazioni sui documenti.

È possibile usare l'archiviazione locale per il contenitore Strumento di etichettatura di esempio di Informazioni sui documenti (FOTT) ?

.

FOTT ha una versione che usa l'archiviazione locale. La versione deve essere installata in un computer Windows. È possibile installarla da questo percorso.

Nella pagina del progetto specificare l'URI della cartella Label come /shared o /shared/sub-dir se i file di etichettatura si trovano in una sottodirectory. Tutti gli altri comportamenti dello Strumento di etichettatura di esempio di Informazioni sui documenti corrispondono al servizio ospitato.

Esiste una procedura consigliata per aumentare le prestazioni?

.

Per le chiamate asincrone, è possibile eseguire più contenitori con archiviazione condivisa. Il contenitore che elabora la chiamata di analisi POST archivia l'output nella risorsa di archiviazione. Qualsiasi altro contenitore può quindi recuperare i risultati dalla risorsa di archiviazione e gestire le chiamate GET. L'ID richiesta non è associato a un contenitore.

Per le chiamate sincrone, è possibile eseguire più contenitori, ma solo un contenitore serve una richiesta. Poiché si tratta di una chiamata di blocco, qualsiasi contenitore del pool può gestire la richiesta e inviare la risposta. In questo caso, un solo contenitore è associato a una richiesta alla volta e non è necessario eseguire il polling.

È possibile configurare i contenitori con l'archiviazione condivisa?

.

I contenitori usano la proprietà Mounts: Shared durante l'avvio per specificare l'archiviazione condivisa per archiviare i file di elaborazione. Per visualizzare l'uso di questa proprietà, vedere la documentazione dei contenitori.

Sicurezza e privacy

Informazioni sui documenti archivia i dati?

Sì, per un breve periodo di tempo.

Per tutte le funzionalità, Informazioni sui documenti archivia temporaneamente i dati e i risultati in Archiviazione di Azure nella stessa area della richiesta. I dati vengono quindi eliminati 24 ore dal momento in cui si invia una richiesta di analisi. Se si desidera che i dati vengano eliminati prima, è possibile chiamare la risposta di analisi dell'eliminazione. Questa API contrassegna i risultati per l'eliminazione ed è disponibile nell'API v4.0.

Altre informazioni su dati, privacy e sicurezza per Informazioni sui documenti.

Dopo l’analisi e l’etichettatura, gli output provvisori dei modelli personalizzati sottoposti a training, vengono archiviati nella stessa posizione di Archiviazione di Azure in cui si archiviano i dati di training. I modelli personalizzati sottoposti a training vengono archiviati in Archiviazione di Azure nella stessa area e isolati logicamente con la sottoscrizione di Azure e le credenziali API.

Altre informazioni e supporto tecnico

Sono disponibili altre risorse per fornire soluzioni alle domande di Informazioni sui documenti di Azure AI?

.

Microsoft Q & A è la pagina Microsoft che riunisce domande e risposte tecniche. È possibile filtrare le query specifiche di Informazioni sui documenti.

È possibile fornire un feedback diretto se, mentre si etichettano i documenti, il servizio non riconosce testo specifico o lo riconosce in modo errato?

.

I modelli di Informazioni sui documenti vengono aggiornati e migliorati continuamente. È possibile inviare un'e-mail al team di Informazioni sui documenti. Se possibile, condividere un documento di esempio con il problema evidenziato.