Condividi tramite


Che cos'è uno spazio di intelligenza artificiale/BI Genie

Questo articolo presenta intelligenza artificiale/BI Genie, una funzionalità di Azure Databricks che consente ai team aziendali di interagire con i dati usando il linguaggio naturale. Usa l'intelligenza artificiale generativa personalizzata in base alla terminologia e ai dati dell'organizzazione, con la possibilità di monitorare e perfezionare le prestazioni tramite il feedback degli utenti.

Panoramica

Esperti di dominio, ad esempio analisti di dati, configurano spazi Genie con set di dati, query di esempio e linee guida per il testo per aiutare Genie a tradurre le domande aziendali in query analitiche. Dopo la configurazione, gli utenti aziendali possono porre domande e generare visualizzazioni per comprendere i dati operativi. È possibile aggiornare continuamente le conoscenze semantiche di Genie man mano che i dati cambiano e gli utenti pongono nuove domande. Per altre informazioni su DatabricksIQ, consultare Funzionalità basate su DatabricksIQ.

AI/BI Genie seleziona i nomi e le descrizioni pertinenti da tabelle e colonne con annotazioni per convertire domande in linguaggio naturale in una query SQL equivalente. Risponde quindi con la query generata e la tabella dei risultati, se possibile. Se Genie non riesce a generare una risposta, può porre domande di completamento per chiarire prima di fornire una risposta.

Caso d'uso di esempio

È possibile creare spazi genie diversi per servire diversi destinatari non tecnici. Gli scenari seguenti descrivono due possibili casi d’utilizzo.

Esempio 1: Visualizzare lo stato dell’opportunità

Un responsabile vendite vuole ottenere lo stato corrente delle opportunità aperte e chiuse per fase nella pipeline di vendita. Possono interagire con lo spazio Genie usando il linguaggio naturale e generare automaticamente una visualizzazione.

La gif seguente mostra questa interazione:

Gif con domanda, risposta e visualizzazione generata automaticamente

Esempio 2: Monitoraggio della logistica

Una società di logistica vuole utilizzare spazi Genie per aiutare gli utenti aziendali di diversi reparti a tenere traccia dei dettagli operativi e finanziari. Hanno istituito uno spazio Genie per i responsabili delle strutture di spedizione per tenere traccia delle spedizioni e un altro per i dirigenti finanziari per comprendere la loro salute finanziaria.

Come Genie genera una risposta

Genie usa un sistema di IA composto per interpretare le domande aziendali e generare risposte. Invece di usare un singolo modello linguistico di grandi dimensioni, i sistemi di intelligenza artificiale composti elaborano le attività nelle applicazioni di intelligenza artificiale combinando più componenti che interagiscono. I sistemi di intelligenza artificiale composti sono un modello di progettazione sempre più comune per le applicazioni di intelligenza artificiale grazie alle prestazioni e alla flessibilità. Per altre informazioni, vedere Il passaggio da modelli a sistemi di intelligenza artificiale composti.

Quando un utente invia una domanda, Genie analizza la richiesta, identifica le origini dati pertinenti e determina come rispondere alla richiesta. Le istruzioni fornite, combinate con i metadati del catalogo unity, consentono a Genie di dedurre sia la logica aziendale che quella tecnica. Genie filtra in modo intelligente le query SQL, i metadati di tabella e di colonna, e la cronologia chat per selezionare le informazioni più rilevanti per rispondere alla richiesta.

Genie usa i componenti seguenti per generare risposte:

  • Metadati della tabella: Include nomi delle tabelle, descrizioni e relazioni di chiavi primarie (PK) e chiavi esterne (FK) definite. Genie usa questi dati durante l'analisi della richiesta e converte il prompt del linguaggio naturale in SQL.
  • Nomi di Colonna e Descrizioni: Genie seleziona in modo intelligente i nomi e le descrizioni delle colonne pertinenti da includere.
  • Esempi di query SQL: Genie seleziona in modo intelligente esempi SQL pertinenti da Instructions.
  • funzioni SQL: tutte le funzioni SQL aggiunte nello spazio.
  • Istruzioni: le note di testo normale fornite come istruzioni generali sono incluse come contesto.
  • Cronologia inviti e risposte: Gli inviti e le risposte della chat corrente vengono inclusi come parte del contesto. Se necessario, a causa dei limiti di token impostati , le parti più vecchie del registro della chat vengono escluse.

Nota

Alcuni dettagli della tabella, ad esempio il proprietario e le dimensioni della tabella, non sono inclusi per impostazione predefinita. Per accedere a queste informazioni, usare le viste dello schema delle informazioni disponibile per tutti i cataloghi di Unity Catalog. Le visualizzazioni predefinite possono includere dettagli non necessari, quindi la creazione di una visualizzazione personalizzata sopra che consente di concentrarsi sulle informazioni specifiche necessarie. Per altre informazioni sugli elementi disponibili nello schema delle informazioni, vedere schema delle informazioni .

Se Genie fornisce una richiesta come risultato, viene eseguita sul magazzino SQL specificato. I ritentativi vengono gestiti automaticamente e SQL Warehouse gestisce la concorrenza e la scalabilità.

Quali dati è necessario utilizzare?

Uno spazio Genie si basa sui dati registrati nel catalogo Unity, incluse tabelle gestite, tabelle esterne, tabelle esterne di altri database, viste e viste materializzate. AI/BI Genie usa i metadati collegati agli oggetti del catalogo Unity per generare risposte. I set di dati con annotazioni ben annotate, abbinati a istruzioni specifiche fornite, sono fondamentali per creare un’esperienza positiva per gli utenti finali.

Databricks consiglia quanto segue:

  • Curare i dati per l'utilizzo analitico: Configurare le viste per ridurre il numero di colonne e aggiungere informazioni per casi d'uso specifici per aumentare la qualità della risposta.
  • Ridurre al minimo il numero di tabelle e colonne in uno spazio Genie: includere solo le tabelle e le colonne necessarie per rispondere alle domande per un determinato dominio. Le tabelle o le colonne non necessarie possono causare la generazione di risposte confuse o errate da parte di Genie o la visualizzazione di un messaggio di errore.
  • Definire le relazioni chiave primaria (PK)/Foreign Key (FK): usare il catalogo Unity per definire le relazioni PK/FK in modo che Genie comprenda il modo in cui i dati sono connessi.

Caricamenti di file

Importante

Questa funzionalità è disponibile in anteprima pubblica.

Gli utenti possono anche caricare i propri file di dati di piccole dimensioni in uno spazio Genie. Per abilitare i caricamenti di file, contattare il team dell'account Databricks. Per altre informazioni, vedere Caricare un file.

Beni attendibili

Gli asset attendibili forniscono un ulteriore livello di garanzia nell'accuratezza di un risultato a un utente dello spazio. Quando viene usato il testo esatto di una query di esempio con parametri o di una funzione SQL per generare una risposta, Genie contrassegna la risposta come asset attendibile . Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.

Conversazioni nella chat

La maggior parte delle interazioni con lo spazio Genie avviene in una finestra di chat. I thread di chat salvano un record di interazioni per ogni utente. Ogni thread di chat mantiene il contesto relativo alle domande precedenti poste. Genie utilizza il contesto nella cronologia delle chat a thread per apprendere il modo in cui gli utenti pongono domande di follow-up per esplorare in modo più approfondito o rifocalizzare un insieme di risultati.

Gli utenti con almeno accesso PUÒ VISUALIZZARE a uno spazio possono visualizzare la propria cronologia delle chat. Gli utenti con almeno i privilegi CAN EDIT possono esaminare tutte le domande e risposte nella scheda Cronologia dello spazio.

Esaminare le risposte

La maggior parte delle risposte include una spiegazione in linguaggio naturale e una tabella che mostra il set di risultati pertinente. Le tabelle di origine vengono visualizzate sotto la spiegazione e la query SQL usata per generare i risultati è disponibile nei dettagli della risposta. Quando una visualizzazione migliora la chiarezza, Genie ne include una. La struttura di ogni risposta dipende dalla domanda.

Gli utenti degli spazi e gli autori possono esaminare le risposte alle loro domande. Possono valutare ogni risposta con un pollice verso l'alto o il pollice verso il basso o chiedere una risposta da rivedere. Gli editor di spazi e gli autori possono esaminare questo feedback usando l'icona della cronologia nella scheda Cronologia nello spazio Genie.

Valutare le risposte con benchmark

I benchmark consentono di aumentare le prestazioni di test e valutazione delle singole risposte in uno spazio Genie. A differenza delle istruzioni, i benchmark sono destinati a valutare, non informare, lo spazio Genie. Genie non usa domande di benchmark o SQL di esempio per migliorare il contesto di Genie.

Utilizzando i benchmark, è possibile eseguire una raccolta di domande di test e usare le risposte per misurare l’accuratezza di Genie. Facoltativamente, è possibile includere un'istruzione SQL che restituisce i risultati previsti. Quando viene eseguita la domanda di benchmark, la risposta di Genie viene confrontata con i risultati forniti dall'istruzione SQL e con un punteggio per l'accuratezza. La domanda è contrassegnata per la revisione se non è stata fornita alcuna risposta SQL.

Vedere Usare i benchmark in uno spazio Genie.

Privacy e sicurezza

D: Quale modello usa Genie?

Genie usa il modello OpenAI di Azure.

D: Quali dati vengono inviati al modello?

Gli spazi genie generano risposte alle domande in linguaggio naturale usando metadati e istruzioni. Genie non ha accesso ai dati a livello di riga.

Per elaborare le risposte, Genie usa quanto segue:

  • Richiesta del linguaggio naturale inviata dall'utente
  • Nomi e descrizioni delle tabelle
  • Titoli e descrizioni delle colonne
  • Istruzioni generali
  • Query SQL di esempio
  • Funzioni SQL

D: Azure OpenAI raccoglie i dati?

No. Databricks ha optato per l'esenzione dal monitoraggio degli abusi e dal programma di revisione umana, in cui Microsoft non archivia richieste e completamenti inviati al servizio OpenAI di Azure. Per altre informazioni, vedere la documentazione di Microsoft.