Wat is een AI/BI Genie-ruimte?
In dit artikel maakt u kennis met AI/BI Genie, een Azure Databricks-functie waarmee zakelijke teams met hun gegevens kunnen communiceren met behulp van natuurlijke taal. Er wordt gebruikgemaakt van generatieve AI die is afgestemd op de terminologie en gegevens van uw organisatie, met de mogelijkheid om de prestaties ervan te bewaken en verfijnen via feedback van gebruikers.
Overzicht
Domeinexperts, zoals gegevensanalisten, configureren Genie-ruimten met gegevenssets, voorbeeldquery's en tekstrichtlijnen om Genie te helpen bij het vertalen van zakelijke vragen naar analytische query's. Na het instellen kunnen zakelijke gebruikers vragen stellen en visualisaties genereren om inzicht te hebben in operationele gegevens. U kunt de semantische kennis van Genie continu bijwerken naarmate uw gegevens veranderen en gebruikers nieuwe vragen stellen. Zie DatabricksIQ-functies die door DatabricksIQ worden mogelijk gemaakt voor meer informatie over DatabricksIQ.
AI/BI Genie selecteert relevante namen en beschrijvingen uit geannoteerde tabellen en kolommen om vragen over natuurlijke taal te converteren naar een equivalente SQL-query. Vervolgens reageert het met de gegenereerde query- en resultatentabel, indien mogelijk. Als Genie geen antwoord kan genereren, kan het opvolgende vragen stellen om te verduidelijken voordat een antwoord wordt verstrekt.
Gebruiksvoorbeelden
U kunt verschillende Genie-ruimten maken om verschillende niet-technische doelgroepen te bedienen. In de volgende scenario's worden twee mogelijke use cases beschreven.
Voorbeeld 1: Verkoopkansstatus visualiseren
Een verkoopmanager wil de huidige status van openstaande en gesloten verkoopkansen per fase in hun verkooppijplijn ophalen. Ze kunnen communiceren met de Genie-ruimte met behulp van natuurlijke taal en automatisch een visualisatie genereren.
In de volgende GIF ziet u deze interactie:
Voorbeeld 2: Traceringslogistiek
Een logistiek bedrijf wil Genie spaces gebruiken om zakelijke gebruikers van verschillende afdelingen te helpen operationele en financiële details bij te houden. Ze hebben een Genie-ruimte opgezet voor hun transportfaciliteitsmanagers om zendingen en een andere voor hun financiële leidinggevenden te volgen om hun financiële gezondheid te begrijpen.
Hoe Genie een antwoord genereert
Genie maakt gebruik van een samengesteld AI-systeem om zakelijke vragen te interpreteren en antwoorden te genereren. In plaats van AI-modellen te gebruiken, die eenvoudige statistische modellen zijn, verwerken samengestelde AI-systemen taken in AI-toepassingen door meerdere interactieonderdelen te combineren. Samengestelde AI-systemen zijn een steeds vaker voorkomend ontwerppatroon voor AI-toepassingen vanwege hun prestaties en flexibiliteit. Zie The Shift from Models to Compound AI Systems voor meer informatie.
Wanneer een gebruiker een vraag indient, parseert Genie de aanvraag, identificeert relevante gegevensbronnen en bepaalt hoe de vraag moet worden beantwoord. Met de instructies die u opgeeft, gecombineerd met metagegevens van Unity Catalog, kan Genie zowel zakelijke als technische logica afleiden. Genie filtert op intelligente wijze voorbeeldquery's, tabel- en kolommetagegevens en chatgeschiedenis om de meest relevante informatie te selecteren voor het beantwoorden van de aanvraag.
Genie gebruikt de volgende onderdelen om reacties te genereren:
- tabelmetagegevens: bevat tabelnamen, beschrijvingen en gedefinieerde relaties met primaire sleutels (PK) en refererende sleutels (FK). Genie gebruikt deze gegevens omdat deze de aanvraag parseert en de prompt voor natuurlijke taal converteert naar SQL.
- Kolomnamen en -beschrijvingen: Genie filtert op intelligente wijze op relevante kolomnamen en beschrijvingen die moeten worden opgenomen.
- SQL-voorbeeldquery's: Genie selecteert intelligent relevante SQL-query's uit Instructies.
- SQL-functies: alle SQL-functies die in de ruimte zijn toegevoegd.
- Instructies: De notities zonder opmaak die als Algemene instructies worden opgenomen, zijn bedoeld als context.
- geschiedenis van vragen en antwoorden: prompts en antwoorden uit de huidige chat worden opgenomen als context. Indien nodig worden de oudste delen van de chatgeschiedenis uitgesloten vanwege de set tokenlimieten.
Notitie
Sommige tabeldetails, zoals de eigenaar en tabelgrootte, zijn niet standaard opgenomen. Voor toegang tot deze informatie kunt u weergaven uit het informatieschema gebruiken dat beschikbaar is voor alle Unity Catalog-catalogi. Standaardweergaven kunnen onnodige details bevatten, zodat u een aangepaste weergave kunt maken die u kan helpen zich te concentreren op de specifieke informatie die u nodig hebt. Zie Informatieschemavoor meer informatie over wat er beschikbaar is in het informatieschema.
Als Genie als resultaat een query retourneert, wordt deze uitgevoerd op het aangewezen SQL-warehouse. Nieuwe pogingen worden automatisch verwerkt en SQL Warehouse verwerkt gelijktijdigheid en schaal.
Welke gegevens moet ik gebruiken?
Een Genie-ruimte kan een of meer tabellen bevatten die zijn geregistreerd bij Unity Catalog, waaronder beheerde tabellen, externe tabellen, refererende tabellen, weergaven en gerealiseerde weergaven. AI/BI Genie gebruikt de metagegevens die zijn gekoppeld aan Unity Catalog-objecten om antwoorden te genereren. Goed geannoteerde gegevenssets, gekoppeld aan specifieke instructies die u opgeeft, zijn essentieel voor het creëren van een positieve ervaring voor eindgebruikers.
Databricks raadt het volgende aan:
- nl-NL: Cureer gegevens voor analytisch gebruik: Laagweergaven om het aantal kolommen te verminderen en informatie toe te voegen die specifiek is voor het gebruiksscenario om de kwaliteit van de respons te verhogen.
- Minimaliseer het aantal tabellen en kolommen in een Genie-ruimte: neem alleen de tabellen en kolommen op die nodig zijn om vragen voor een bepaald domein te beantwoorden. Onnodige tabellen of kolommen kunnen ertoe leiden dat Genie verwarrende of onjuiste antwoorden geeft of een foutbericht weergeeft.
- Relaties tussen primaire sleutels (PK)/refererende sleutels (FK) definiëren: Gebruik Unity Catalog om PK/FK-relaties te definiëren, zodat Genie begrijpt hoe uw gegevens zijn verbonden.
Vertrouwde assets
Vertrouwde assets bieden een extra zekerheid over de nauwkeurigheid van een resultaat aan een gebruiker in de ruimte. Wanneer de exacte tekst van een geparameteriseerde voorbeeldquery of SQL-functie wordt gebruikt om een antwoord te genereren, markeert Genie het antwoord als een betrouwbaar middel. Zie Vertrouwde assets gebruiken in AI/BI Genie-ruimten.
Chatthreads
De meeste Genie-ruimteinteracties vinden plaats in een chatvenster. Met chatthreads wordt een record van interacties voor elke gebruiker opgeslagen. Elke chatthread onderhoudt context over eerdere vragen die zijn gesteld. Genie gebruikt context in de threaded chatgeschiedenis om te leren wanneer gebruikers vervolgvragen stellen om een resultatenset verder te verkennen of opnieuw te richten.
Gebruikers met ten minste CAN VIEW-toegang tot een ruimte kunnen hun eigen chatgeschiedenis bekijken. Gebruikers met ten minste CAN EDIT-bevoegdheden kunnen alle vragen en antwoorden bekijken op het tabblad Geschiedenis van de ruimte.
Antwoorden controleren
De meeste antwoorden bevatten een uitleg in natuurlijke taal en een tabel met de relevante resultatenset. De precieze antwoordstructuur varieert op basis van de vraag. Alle antwoorden bevatten de SQL-query die is gegenereerd om de vraag te beantwoorden.
Ruimtegebruikers en auteurs kunnen de antwoorden op hun vragen bekijken. Ze kunnen elke reactie beoordelen met een duim omhoog, een duim omlaag, of vragen om een beoordeling van een antwoord. Ruimte-editors en auteurs kunnen deze feedback bekijken met behulp van het tabblad Geschiedenis in de ruimte Genie.
Antwoorden evalueren met benchmarks
Met benchmarks kunt u tests en evaluatie van afzonderlijke reacties in een Genie-ruimte omhoog schalen. In tegenstelling tot instructies zijn benchmarks bedoeld om uw Genie-ruimte te evalueren, niet te informeren. Genie gebruikt geen benchmarkvragen of voorbeeld-SQL om de context van Genie te verbeteren.
Met behulp van benchmarks kunt u een verzameling testvragen uitvoeren en de antwoorden gebruiken om de nauwkeurigheid van Genie te meten. U kunt desgewenst een SQL-instructie opnemen waarmee de verwachte resultaten worden geretourneerd. Wanneer de benchmarkvraag wordt uitgevoerd, wordt het antwoord van Genie vergeleken met de resultaten van de SQL-instructie en beoordeeld op nauwkeurigheid. De vraag is gemarkeerd voor beoordeling als er geen SQL-antwoord is opgegeven.
Zie Benchmarks gebruiken in een Genie-ruimte.
Privacy en beveiliging
V: Welk model gebruikt Genie?
Genie maakt gebruik van het Azure OpenAI-model.
V: Welke gegevens worden naar het model verzonden?
Genie-ruimten genereren antwoorden op vragen over natuurlijke taal met behulp van metagegevens en instructies. Genie heeft geen toegang tot gegevens op rijniveau.
Om reacties te verwerken, gebruikt Genie het volgende:
- De natuurlijke taalprompt die door de gebruiker is ingediend
- Tabelnamen en -beschrijvingen
- Kolomtitels en -beschrijvingen
- Algemene instructies
- Voorbeeld van SQL-query's
- SQL-functies
V: Verzamelt Azure OpenAI mijn gegevens?
Nee Databricks heeft gekozen voor de uitzondering van misbruikbewaking en het human review-programma, waaronder Microsoft geen prompts en voltooiingen opslaat die naar de Azure OpenAI-service worden verzonden. Zie de documentatie van Microsoft voor meer informatie.