Quale modello occorre scegliere?
Importante
- Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
- La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
- Stati Uniti centro-settentrionali
Informazioni sui documenti di Azure AI supporta un'ampia gamma di modelli che consentono di aggiungere funzionalità di elaborazione intelligente dei documenti alle applicazioni e ottimizzare i flussi di lavoro. La selezione del modello corretto è essenziale per garantire il raggiungimento degli obiettivi aziendali. In questo articolo vengono esaminati i modelli di Informazioni sui documenti disponibili e vengono fornite indicazioni su come scegliere la soluzione migliore in base ai progetti.
I grafici decisionali seguenti evidenziano le funzionalità di ogni modello supportato per consentire di scegliere il modello più adatto alle esigenze e ai requisiti dell'applicazione.
Importante
Assicurarsi di controllare la pagina supporto per la lingua per il testo della lingua e l'estrazione dei campi supportati per funzionalità.
Modelli di analisi dei documenti con training preliminare
Tipo di documento | Esempio | Dati da estrarre | Soluzione ottimale |
---|---|---|---|
Documento generico. | Contratto o lettera. | Si desidera estrarre principalmente righe di testo scritte o stampate, parole, posizioni e lingue rilevate. | Modello Lettura OCR |
Documento che include informazioni strutturali. | Report o studio. | Oltre a testo scritto o stampato, è necessario estrarre informazioni strutturali come tabelle, indicatori di selezione, paragrafi, titoli, intestazioni e sottotitoli. | Modello di analisi layout |
Documento strutturato o semistrutturato che include il contenuto formattato come campi (chiavi) e valori. | Un modulo o un documento che è un formato standardizzato comunemente usato nell'azienda o nel settore, ad esempio una richiesta di credito o un sondaggio. | Si vogliono estrarre campi e valori, inclusi quelli non coperti dai modelli predefiniti specifici dello scenario senza dover eseguire il training di un modello personalizzato. | **Modello di analisi del layout con il parametro della stringa di query facoltativo features=keyValuePairs abilitato ** |
Modelli specifici dello scenario con training preliminare
Tipo di documento | Dati da estrarre | Soluzione ottimale |
---|---|---|
Imposta USA unificata | Si vogliono estrarre informazioni chiave in tutti i moduli fiscali W2, 1040, 1090, 1098 da un singolo file senza eseguire alcuna classificazione personalizzata. | Modello Imposta USA unificata |
Imposta USA W-2 | Si vogliono estrarre informazioni chiave come stipendio, retribuzioni e imposte trattenute. | Modello fiscale W-2 Stati Uniti |
Imposta USA 1098 | Si vogliono estrarre i dettagli degli interessi ipotecari, ad esempio capitale, punti e imposte. | Modello fiscale 1098 Stati Uniti |
Imposta USA 1098-E | Si vogliono estrarre i dettagli degli interessi dei prestiti agli studenti, ad esempio il creditore e l'importo degli interessi. | Modello fiscale 1098-E Stati Uniti |
Imposta USA 1098T | Si vogliono estrarre i dettagli idonei relativi a rette scolastiche, ad esempio modifiche a borse di studio, stato degli studenti e informazioni sul creditore. | Modello fiscale 1098-T Stati Uniti |
Imposta USA 1099 (varianti) | Si vogliono estrarre informazioni dai moduli 1099 e dalle relative variazioni (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Modello fiscale 1099 Stati Uniti |
Imposta USA 1040 (varianti) | Si vogliono estrarre informazioni dai moduli 1040 e dalle relative variazioni (Pianificazione 1, Pianificazione 2, Pianificazione 3, Pianificazione 8812, Pianificazione A, Pianificazione B, Pianificazione C, Pianificazione D, Pianificazione E, Pianificazione EIC , Pianificazione F, Pianificazione H, Pianificazione J, Pianificazione R, Pianificazione SE , Pianificazione Senior). |
Modello fiscale 1040 Stati Uniti |
Rendiconto bancario | Si desidera estrarre le informazioni chiave dal rendiconto bancario USA | \Rendiconto bancario |
Assegno bancario | Si desidera estrarre le informazioni chiave dall'assegno. | Assegno bancario |
Contratto (accordo legale tra le parti). | Si vogliono estrarre i dettagli del contratto, ad esempio parti, date e intervalli. | Modello di contratto |
Scheda assicurazione sanitaria o ID assicurazione sanitaria. | Si desidera estrarre informazioni chiave come assicuratore, ID membro, copertura assicurativa e numero di gruppo. | Modello per schede assicurazione sanitaria |
Carta di credito/debito | Si vogliono estrarre le informazioni chiave delle carte bancarie, ad esempio il numero di carta e il nome della banca. | Modello di carta di credito/debito |
Certificato di matrimonio | Si vogliono estrarre le informazioni chiave dai certificati di matrimonio. | Modello di certificato di matrimonio |
Fattura o estratto conto | Si vogliono estrarre le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione e l'importo dovuto. | Modello di fattura |
Ricevuta, voucher o ricevuta di hotel a pagina singola. | Si vogliono estrarre le informazioni chiave, ad esempio il nome del fornitore di servizi, la data della transazione e il totale delle transazioni. | Modello per ricevute |
Documento di identità come una patente di guida statunitense o un passaporto internazionale | Si vogliono estrarre le informazioni chiave, ad esempio nome, cognome, data di nascita, indirizzo e firma. | Modello Documento di identità (ID) |
Bozza di pagamento | Si desidera estrarre le informazioni chiave dal documento di bozza di pagamento. | Modello bozza di pagamento |
Mutuo 1003 Stati Uniti | Si vogliono estrarre le informazioni chiave dalla richiesta di finanziamento residenziale uniforme. | Modello di modulo 1003 |
Mutuo 1004 Stati Uniti | Si desidera estrarre le informazioni chiave dalla richiesta di valutazione residenziale uniforme (URAR). | Modello di modulo 1004 |
Mutuo 1005 Stati Uniti | Si desidera estrarre le informazioni chiave dal modulo Verifica dell'occupazione | Modello di modulo 1005 |
Mutuo 1008 Stati Uniti | Si vogliono estrarre le informazioni chiave dal riepilogo di sottoscrizione e trasmissione uniforme. | Modello di modulo 1008 |
Divulgazione di chiusura mutuo Stati Uniti | Si vogliono estrarre le informazioni chiave da un modulo di divulgazione di chiusura mutuo. | Modello di modulo di divulgazione di chiusura mutuo |
Documenti di tipo misto con elementi strutturati, semistrutturati e/o non strutturati | Si vogliono estrarre coppie chiave-valore, indicatori di selezione, tabelle, campi di firma e aree selezionate non estratte da modelli di documento predefiniti o generali. | Modello personalizzato |
Suggerimento
- Se non si è certi del modello con training preliminare da usare, provare il modello di layout con il parametro della stringa di query facoltativo
features=keyValuePairs
abilitato. - Il modello di layout è basato sul motore OCR di lettura per rilevare pagine, tabelle, stili, testo, righe, parole, posizioni e lingue.
Modelli di estrazione personalizzati
Set di training | Documenti di esempio | Soluzione ottimale |
---|---|---|
Documenti strutturati, coerenti e con layout statico. | Moduli strutturati, ad esempio questionari o richieste. | Modello personalizzato |
Dati non strutturati e semistrutturati. | ● Strutturati → sondaggi ● Semistrutturati → fatture |
Modello neurale personalizzato |
Documenti non strutturati, documenti con modelli diversi. | ● Documenti non strutturati come contratti o lettere ● Modelli di documento diversi, ad esempio rendiconti di prestito di diverse società ipotecarie |
Modello generativo personalizzato |
Raccolta di diversi modelli sottoposti a training su documenti di tipo simile. | ● Ordini di acquisto di forniture ● Ordini di acquisto attrezzature ● Ordini di acquisto mobili Tutti composti in un unico modello. |
Modello personalizzato composto |
Modello di classificazione personalizzato
Set di training | Documenti di esempio | Soluzione ottimale |
---|---|---|
Almeno due tipi diversi di documenti. | Moduli, lettere o documenti | Modello di classificazione personalizzato |