Sdílet prostřednictvím


Co je prostor AI/BI Genie

Tento článek představuje funkci AI/BI Genie, která umožňuje obchodním týmům pracovat s daty pomocí přirozeného jazyka. Využívá generující AI přizpůsobenou terminologii a datům vaší organizace s možností sledovat a upřesňovat jeho výkon prostřednictvím zpětné vazby uživatelů.

Přehled

Odborníci na domény, jako jsou datoví analytici, konfigurují prostory Genie s datovými sadami, ukázkovými dotazy a textovými pokyny, které Genie pomáhají překládat obchodní otázky do analytických dotazů. Po nastavení můžou firemní uživatelé klást otázky a generovat vizualizace, aby porozuměli provozním datům. Sémantické znalosti Genie můžete průběžně aktualizovat, protože vaše data se mění a uživatelé představují nové otázky. Další informace o DatabricksIQ najdete v tématu Funkce založené na DatabricksIQ.

AI/BI Genie vybere relevantní názvy a popisy z anotovaných tabulek a sloupců a převede otázky v přirozeném jazyce na ekvivalentní dotaz SQL. Pokud je to možné, odpoví vygenerovaným dotazem a tabulkou výsledků. Pokud Genie nemůže vygenerovat odpověď, může se zeptat na následné otázky, které upřesní před poskytnutím odpovědi.

Příklady případů použití

Můžete vytvořit různé prostory Genie, které budou sloužit různým jiným než technickým cílovým skupinám. Následující scénáře popisují dva možné případy použití.

Příklad 1: Vizualizace stavu příležitosti

Manažer prodeje chce získat aktuální stav otevřených a uzavřených příležitostí podle fáze v prodejním kanálu. Můžou pracovat s prostorem Genie pomocí přirozeného jazyka a automaticky vygenerovat vizualizaci.

Následující obrázek gif znázorňuje tuto interakci:

Gif s ukázkovou otázkou, odpovědí a automaticky vygenerovanou vizualizací

Příklad 2: Sledování logistiky

Logistická společnost chce používat Prostory Genie k tomu, aby firemním uživatelům z různých oddělení pomohla sledovat provozní a finanční podrobnosti. Nastavili prostor Genie pro své manažery přepravních zařízení, aby mohli sledovat zásilky a další pro finanční manažery, aby porozuměli svému finančnímu zdraví.

Jak Genie vygeneruje odpověď

Genie používá složený systém AI k interpretaci obchodních otázek a generování odpovědí. Místo použití modelů AI, což jsou jednoduché statistické modely, složené systémy AI zpracovávají úlohy v aplikacích AI kombinováním více interagujících komponent. Složené systémy AI jsou stále častějším vzorem návrhu pro aplikace umělé inteligence z důvodu jejich výkonu a flexibility. Další informace naleznete v tématu Přechod z modelů na složené systémy AI .

Když uživatel odešle otázku, Genie žádost analyzuje, identifikuje relevantní zdroje dat a určí, jak na výzvu odpovědět. Pokyny, které poskytnete v kombinaci s metadaty katalogu Unity, umožňují Genie odvodit obchodní i technickou logiku. Genie inteligentně filtruje ukázkové dotazy SQL, metadata tabulek a sloupců a historii chatu a vybere nejrelevavantnější informace pro zodpovězení požadavku.

Genie používá k vygenerování odpovědí následující komponenty:

  • metadata tabulky: Zahrnuje názvy tabulek, popisy a definované relace primárního klíče (PK) a cizího klíče (FK). Genie použije tato data při analýze požadavku a převede výzvu přirozeného jazyka na SQL.
  • Názvy a popisy sloupců: Genie inteligentně filtruje relevantní názvy sloupců a popisy, které se mají zahrnout.
  • Ukázkové dotazy SQL: Genie inteligentně vybere relevantní příklady SQL z Pokynů.
  • funkce SQL: Všechny funkce SQL přidané do prostoru.
  • Pokyny: Poznámky ve formátu prostého textu, poskytnuté jako obecné instrukce, jsou zahrnuty jako kontext.
  • historie výzev a odpovědí: Výzvy a odpovědi z aktuálního chatu jsou zahrnuty jako kontext. V případě potřeby jsou kvůli nastaveným omezením tokenů vyloučeny nejstarší části záznamu chatu.

Poznámka:

Některé podrobnosti tabulky, například vlastník a velikost tabulky, nejsou ve výchozím nastavení zahrnuty. Pro přístup k tomuto informacím můžete použít zobrazení ze schématu informací dostupného pro všechny katalogy Unity. Výchozí zobrazení můžou obsahovat nepotřebné podrobnosti, takže vytvoření vlastního zobrazení nad tím může pomoct zaměřit se na konkrétní potřebné informace. Další informace o tom, co je k dispozici v Informačním schématu, naleznete v tématu Informační schéma.

Pokud Genie v důsledku toho vrátí dotaz, spustí se v určeném SQL Warehouse. Opakované pokusy se zpracovávají automaticky a SQL sklad zpracovává souběžnost a škálování.

Jaká data mám použít?

Prostor Genie může obsahovat jednu nebo více tabulek zaregistrovaných v katalogu Unity, včetně spravovaných tabulek, externích tabulek, cizích tabulek, zobrazení a materializovaných zobrazení. AI/BI Genie používá metadata připojená k objektům katalogu Unity k vygenerování odpovědí. Dobře anotované datové sady spárované s konkrétními pokyny, které poskytnete, jsou klíčem k vytvoření pozitivního prostředí pro koncové uživatele.

Databricks doporučuje následující:

  • Připravit data pro analytickou spotřebu: Vrstevnaté zobrazení ke snížení počtu sloupců a přidání informací specifických pro použití ke zlepšení kvality odpovědí.
  • Minimalizovat počet tabulek a sloupců v prostoru Genie: Zahrňte pouze tabulky a sloupce potřebné k zodpovězení otázek pro danou doménu. Nepotřebné tabulky nebo sloupce můžou způsobit, že Genie poskytne matoucí nebo nesprávné odpovědi nebo zobrazí chybovou zprávu.
  • Definovat relace primárního klíče (PK)/cizího klíče (FK): Pomocí katalogu Unity definujte relace PK/FK, aby Genie pochopila, jak jsou vaše data připojená.

Důvěryhodné prostředky

Důvěryhodné zdroje poskytují uživateli kosmického prostoru další vrstvu jistoty ohledně přesnosti výsledku. Když se k vygenerování odpovědi použije přesný text parametrizovaného ukázkového dotazu nebo funkce SQL, Označí Genie odpověď jako důvěryhodný prostředek. Viz Použití důvěryhodných prostředků v prostorech AI/BI Genie.

Vlákna konverzací

Většina interakcí s prostorem Genie probíhá v okně chatu. Vlákna chatu ukládají záznam interakcí pro každého uživatele. Každé vlákno chatu udržuje kontext předchozích otázek, které byly položeny. Genie používá kontext z historie vlákna chatu k tomu, aby pochopil, jak uživatelé pokládají následné otázky pro další zkoumání nebo úpravu sady výsledků.

Uživatelé, kteří mají alespoň přístup CAN VIEW k prostoru, můžou zobrazit svou vlastní historii chatu. Uživatelé s alespoň s oprávněním CAN EDIT můžou zkontrolovat všechny otázky a odpovědi na kartě Historie prostoru .

Kontrola odpovědí

Většina odpovědí obsahuje vysvětlení přirozeného jazyka a tabulku zobrazující příslušnou sadu výsledků. Přesná struktura odpovědí se liší v závislosti na otázce. Všechny odpovědi zahrnují dotaz SQL, který byl vygenerován pro odpověď na otázku.

Uživatelé a autoři prostoru můžou zkontrolovat odpovědi na své otázky. Každou odpověď můžou ohodnotit palcem nahoru nebo palcem dolů nebo požádat o odpověď, která se má zkontrolovat. Editory prostoru a autoři mohou tuto zpětnou vazbu zkontrolovat pomocí ikony historie na kartě Historie v prostoru Genie.

Vyhodnocení odpovědí pomocí srovnávacích testů

Srovnávací testy umožňují vertikálně navýšit kapacitu testování a hodnocení jednotlivých odpovědí v prostoru Genie. Na rozdíl od pokynů mají být srovnávací testy vyhodnoceny, ne informovat, váš prostor Genie. Genie k vylepšení kontextu Genie nepoužívá srovnávací dotazy ani příklad SQL.

Pomocí srovnávacích testů můžete spustit kolekci testovacích otázek a použít odpovědi k měření přesnosti Genie. Volitelně můžete zahrnout příkaz SQL, který vrátí očekávané výsledky. Když se spustí otázka srovnávacího testu, porovná se odpověď Genie s výsledky poskytnutými příkazem SQL a skóre přesnosti. Pokud nebyla zadána žádná odpověď SQL, je tato otázka označena ke kontrole.

Viz Použití srovnávacích testů v prostoru Genie.

Ochrana osobních údajů a zabezpečení

Otázka: Jaký model Genie používá?

Genie používá model Azure OpenAI.

Otázka: Jaká data se do modelu odesílají?

Genie spaces generují odpovědi na otázky v přirozeném jazyce pomocí metadat a pokynů. Genie nemá přístup k datům na úrovni řádků.

Ke zpracování odpovědí používá Genie následující:

  • Výzva k přirozenému jazyku odeslaná uživatelem
  • Názvy a popisy tabulek
  • Názvy a popisy sloupců
  • Obecné pokyny
  • Příklady dotazů SQL
  • Funkce SQL

Otázka: Shromažďuje Azure OpenAI moje data?

Ne. Společnost Databricks se přihlásila k výjimce z programu pro monitorování zneužití a kontroly lidí, pod kterým Microsoft neukládá žádné výzvy a dokončení odesílané do služby Azure OpenAI. Další informace najdete v dokumentaci Microsoftu.