Che cos'è Visione di Azure per intelligenza artificiale?
Il servizio Visione di Azure AI consente di accedere ad algoritmi avanzati che elaborano le immagini e restituiscono informazioni, in base alle caratteristiche visive a cui si è interessati. Nella tabella seguente sono elencate le principali categorie di prodotti.
Servizio | Descrizione |
---|---|
Riconoscimento ottico dei caratteri (OCR) | Il servizio OCR (Optical Character Recognition) estrae testo dalle immagini. È possibile usare l'API Lettura per estrarre testo stampato e scritto a mano da foto e documenti. Usa modelli basati sull'apprendimento avanzato e funziona con il testo su varie superfici e sfondi. Tra cui documenti aziendali, fatture, ricevute, poster, biglietti da visita, lettere e lavagne. Le API di riconoscimento ottico dei caratteri supportano l'estrazione di testo stampato in diverse lingue. Per iniziare, seguire la guida di avvio rapido di OCR. |
Analisi delle immagini | Il servizio Analisi immagini estrae molte funzionalità visive dalle immagini, ad esempio oggetti, visi, contenuto per adulti e descrizioni di testo generate automaticamente. Per iniziare, seguire la guida introduttiva all'analisi delle immagini. |
Viso | Il servizio Viso fornisce algoritmi di intelligenza artificiale che rilevano, riconoscono e analizzano i visi umani nelle immagini. Il software di riconoscimento facciale è importante in molti scenari diversi, ad esempio l’identificazione, il controllo dell'accesso touchless e la sfocatura del viso per la privacy. Per iniziare, seguire la guida introduttiva di Viso. |
Analisi video | L'analisi video include funzionalità correlate ai video, come l'analisi spaziale e il recupero video. L’Analisi spaziale analizza la presenza e lo spostamento delle persone in un feed video e produce eventi a cui altri sistemi possono rispondere. Installare il contenitore Analisi spaziale per iniziare. Recupero video consente di creare un indice di video che è possibile cercare con il linguaggio naturale. |
Visione di Azure AI per la gestione delle risorse digitali
Visione di Azure AI può ottimizzare molti scenari di gestione delle risorse digitali. La gestione delle risorse digitali è il processo aziendale per l'organizzazione, l'archiviazione e il recupero di risorse multimediali elaborate e per la gestione dei diritti e delle autorizzazioni digitali. Una società potrebbe ad esempio voler raggruppare e identificare le immagini in base a logo visibili, visi, oggetti, colori e così via. In alternativa, si potrebbe voler generare automaticamente didascalie per le immagini e allegare parole chiave in modo che siano ricercabili. Per una soluzione di gestione delle risorse digitali all-in-one che usa Servizi di Azure AI, Azure AI Search e creazione di report intelligenti, vedere la guida su Solution Accelerator per Knowledge Mining in GitHub. Per altri esempi di gestione delle risorse digitali, vedere il repository Modelli per la soluzione Visione di Azure AI.
Operazioni preliminari
Usare Vision Studio per provare rapidamente le funzionalità di Visione di Azure AI nel browser Web.
Per iniziare a creare Visione di Azure AI nell'app, seguire una guida di avvio rapido.
- Avvio rapido - Riconoscimento ottico dei caratteri (OCR)
- Avvio rapido: analisi delle immagini
- Avvio rapido: Viso di Azure
- Avvio rapido: contenitore Analisi spaziale
Requisiti immagine
Visione di Azure AI può analizzare immagini che rispettano i requisiti seguenti:
- L'immagine deve essere presentata in formato JPEG, PNG, GIF o BMP
- Le dimensioni del file dell'immagine devono essere minori di 4 megabyte (MB)
- Le dimensioni dell'immagine devono essere superiori a 50 x 50 pixel
- Per l'API di lettura (Read), le dimensioni dell'immagine devono essere comprese tra 50 x 50 e 10.000 x 10.000 pixel.
Privacy e sicurezza dei dati
Come con tutti i Servizi di Azure AI, gli sviluppatori che usano il servizio Visione di Azure AI devono conoscere i criteri di Microsoft per i dati dei clienti. Per altre informazioni, vedere la pagina sui Servizi di Azure AI nel Centro protezione di Microsoft.
Passaggi successivi
Seguire una guida introduttiva per implementare ed eseguire un servizio nel linguaggio di sviluppo preferito.