Vad är ett AI/BI Genie-utrymme
Den här artikeln introducerar AI/BI Genie, en Azure Databricks-funktion som gör det möjligt för affärsteam att interagera med sina data med naturligt språk. Den använder generativ AI som är skräddarsydd för organisationens terminologi och data, med möjlighet att övervaka och förfina dess prestanda genom feedback från användaren.
Översikt
Domänexperter, till exempel dataanalytiker, konfigurerar Genie-utrymmen med datauppsättningar, exempelfrågor och textriktlinjer för att hjälpa Genie att översätta affärsfrågor till analysfrågor. Efter konfigurationen kan företagsanvändare ställa frågor och generera visualiseringar för att förstå driftdata. Du kan kontinuerligt uppdatera Genie semantiska kunskaper när dina data ändras och användarna ställer nya frågor. Mer information om DatabricksIQ finns i DatabricksIQ-baserade funktioner.
AI/BI Genie väljer relevanta namn och beskrivningar från kommenterade tabeller och kolumner för att konvertera frågor på naturligt språk till en motsvarande SQL-fråga. Sedan svarar den med den genererade fråge- och resultattabellen, om möjligt. Om Genie inte kan generera ett svar kan det ställa uppföljande frågor för att klargöra innan du ger ett svar.
Användningsexempel
Du kan skapa olika Genie-utrymmen för att betjäna olika icke-tekniska målgrupper. Följande scenarier beskriver två möjliga användningsfall.
Exempel 1: Visualisera affärsmöjlighetsstatus
En säljchef vill få aktuell status för öppna och stängda affärsmöjligheter efter steg i försäljningspipelinen. De kan interagera med Genie-utrymmet med naturligt språk och automatiskt generera en visualisering.
Följande gif visar den här interaktionen:
Exempel 2: Spåra logistik
Ett logistikföretag vill använda Genie-utrymmen för att hjälpa företagsanvändare från olika avdelningar att spåra operativ och ekonomisk information. De skapade ett Genie-utrymme för sina leveransanläggningschefer för att spåra leveranser och ett annat för sina ekonomichefer för att förstå deras ekonomiska hälsa.
Hur Genie genererar ett svar
Genie använder ett sammansatt AI-system för att tolka affärsfrågor och generera svar. I stället för att använda AI-modeller, som är enkla statistiska modeller, bearbetar sammansatta AI-system uppgifter i AI-program genom att kombinera flera interagerande komponenter. Sammansatta AI-system är ett allt vanligare designmönster för AI-program på grund av deras prestanda och flexibilitet. Mer information finns i Övergången från modeller till sammansatta AI-system .
När en användare skickar en fråga parsar Genie begäran, identifierar relevanta datakällor och bestämmer hur den ska svara på uppmaningen. Med de instruktioner som du anger i kombination med Unity Catalog-metadata kan Genie härleda både affärslogik och teknisk logik. Genie filtrerar intelligent SQL-frågor, tabell- och kolumnmetadata och chatthistorik för att välja den mest relevanta informationen för att besvara begäran.
Genie använder följande komponenter för att generera svar:
- Tabellmetadata: Innehåller tabellnamn, beskrivningar och definierade relationer med primärnyckel (PK) och sekundärnyckel (FK). Genie använder dessa data när den parsar begäran och konverterar den naturliga språkprompten till SQL.
- Kolumnnamn och beskrivningar: Genie använder intelligenta filter för att inkludera relevanta kolumnnamn och beskrivningar.
- Exempel på SQL-frågor: Genie väljer intelligent relevanta SQL-exempel från Instruktioner.
- SQL-funktioner: Alla SQL-funktioner som har lagts till i utrymmet.
- Instruktioner: De klartextanteckningar som tillhandahålls som Allmänna instruktioner ingår för sammanhang.
- historik för frågor och svar: Frågor och svar från den aktuella chatten ingår som kontext. Om det behövs utesluts de äldsta delarna av chattposten på grund av tokenbegränsningar.
Kommentar
Vissa tabelldetaljer, till exempel ägare och tabellstorlek, ingår inte som standard. Om du vill komma åt den här informationen kan du använda vyer från informationsschemat som är tillgängligt för alla Unity Catalog-kataloger. Standardvyer kan innehålla onödig information, så att skapa en anpassad vy ovanpå det kan hjälpa dig att fokusera på den specifika information du behöver. Mer information om vad som är tillgängligt i informationsschemat finns i Information-schema.
Om Genie returnerar en fråga som ett resultat körs den på det avsedda SQL-lagret. Återförsök hanteras automatiskt och SQL-lagret hanterar samtidighet och skalning.
Vilka data ska jag använda?
Ett Genie-utrymme kan innehålla en eller flera tabeller som är registrerade i Unity Catalog, inklusive hanterade tabeller, externa tabeller, sekundärtabeller, vyer och materialiserade vyer. AI/BI Genie använder metadata som är kopplade till Unity Catalog-objekt för att generera svar. Väl kommenterade datauppsättningar, i kombination med specifika instruktioner som du anger, är nyckeln till att skapa en positiv upplevelse för slutanvändarna.
Databricks rekommenderar följande:
- Behandla data för analytisk användning: Lager av vyer för att minska antalet kolumner och lägga till användningsfallsspecifik information för att öka svarskvaliteten.
- Minimera antalet tabeller och kolumner i ett Genie-blanksteg: Inkludera endast de tabeller och kolumner som behövs för att besvara frågor för en viss domän. Onödiga tabeller eller kolumner kan orsaka att Genie ger förvirrande eller felaktiga svar eller visar ett felmeddelande.
- Definiera relationer med primärnyckel (PK)/sekundärnyckel (FK): Använd Unity Catalog för att definiera PK/FK-relationer så att Genie förstår hur dina data är anslutna.
Betrodda tillgångar
Betrodda tillgångar förmedlar ett extra lager av säkerhet i noggrannheten för ett resultat till en utrymmesanvändare. När den exakta texten i en parameteriserad exempelfråga eller SQL-funktion används för att generera ett svar markerar Genie svaret som en Betrodd tillgång. Se Använda betrodda tillgångar i AI/BI Genie-utrymmen.
Chatttrådar
De flesta Genie-rymdinteraktioner sker i ett chattfönster. Chatttrådar sparar en logg över interaktioner för varje användare. Varje chatttråd har kontext om tidigare frågor som har ställts. Genie använder kontexten i den trådade chatthistoriken för att lära sig när användare ställer uppföljningsfrågor för att utforska ytterligare eller fokusera om en resultatuppsättning.
Användare med minst CAN VIEW-åtkomst till ett utrymme kan visa sin egen chatthistorik. Användare med minst behörigheten 'kan redigera' kan granska alla frågor och svar i fliken Historik.
Granska svar
De flesta svar innehåller en förklaring av naturligt språk och en tabell som visar relevant resultatuppsättning. Den exakta svarsstrukturen varierar beroende på frågan. Alla svar inkluderar SQL-frågan som genererades för att besvara frågan.
Utrymmesanvändare och författare kan granska svaren på sina frågor. De kan betygsätta varje svar med tummen upp eller tummen ner eller be om att ett svar ska granskas. Utrymmesredigerare och författare kan granska den här feedbacken med hjälp av ikonen historik i Genie-utrymmet.
Utvärdera svar med benchmarks
Med benchmarks kan du skala upp testning och utvärdering av enskilda svar i ett Genie-utrymme. Till skillnad från instruktioner är benchmarks avsedda att utvärdera, inte informera, ditt Genie-utrymme. Genie använder inte benchmark-frågor eller sql-exempel för att förbättra Genie-kontexten.
Med hjälp av benchmarks kan du köra en samling testfrågor och använda svaren för att mäta Genie:s noggrannhet. Du kan också inkludera en SQL-instruktion som returnerar det förväntade resultatet. När benchmark-frågan körs jämförs Genie-svaret med resultaten från SQL-instruktionen och poängsätts för noggrannhet. Frågan markeras för granskning om inget SQL-svar har angetts.
Se Använda benchmarks i ett Genie-utrymme.
Sekretess och säkerhet
F: Vilken modell använder Genie?
Genie använder Azure OpenAI-modellen.
F: Vilka data skickas till modellen?
Genie spaces genererar svar på frågor om naturligt språk med hjälp av metadata och instruktioner. Genie har inte åtkomst till data på radnivå.
För att bearbeta svar använder Genie följande:
- Uppmaningen till naturligt språk som skickats av användaren
- Tabellnamn och beskrivningar
- Kolumnrubriker och beskrivningar
- Allmänna instruktioner
- Exempel på SQL-frågor
- SQL-funktioner
F: Samlar Azure OpenAI in mina data?
Nej. Databricks har valt undantaget från program för övervakning av missbruk och mänsklig granskning, enligt vilket Microsoft inte lagrar några uppmaningar och slutföranden som skickas till Azure OpenAI-tjänsten. Mer information finns i Microsofts dokumentation.