Was ist ein AI/BI Genie Space
In diesem Artikel wird AI/BI Genie vorgestellt, ein Azure Databricks-Feature, mit dem Geschäftsteams mit ihren Daten mit natürlicher Sprache interagieren können. Es verwendet generative KI, die auf die Terminologie und Daten Ihrer Organisation zugeschnitten ist, mit der Möglichkeit, die Leistung durch Benutzerfeedback zu überwachen und zu verfeinern.
Übersicht
Domänenfachleute wie Datenanalystinnen und -analysten konfigurieren Genie Spaces mit Datasets, Beispielabfragen und Textrichtlinien, um Genie bei der Übersetzung von Geschäftsfragen in analytische Abfragen zu helfen. Nach der Einrichtung können Geschäftsbenutzerinnen und -benutzer Fragen stellen und Visualisierungen generieren, um betriebstechnische Daten zu verstehen. Sie können kontinuierlich sein semantisches Wissen aktualisieren, wenn sich Ihre Daten ändern und die Benutzer und Benutzerinnen neue Fragen stellen. Zusätzliche Informationen zum Databricks-IQ finden Sie unter Häufig gestellte Fragen zum DatabricksIQ-powered Feature.
AI/BI Genie wählt relevante Namen und Beschreibungen aus kommentierten Tabellen und Spalten aus, um Fragen in natürlicher Sprache in eine entsprechende SQL-Abfrage zu konvertieren. Anschließend antwortet es nach Möglichkeit mit der generierten Abfrage- und Ergebnistabelle. Wenn Genie keine Antwort generieren kann, kann er Nachverfolgungsfragen stellen, um zu klären, bevor er eine Antwort vorgibt.
Beispiele für Anwendungsfälle
Sie können verschiedene Genie Spaces für verschiedene nicht technische Zielgruppen erstellen. In den folgenden Szenarien werden zwei mögliche Anwendungsfälle beschrieben.
Beispiel 1: Visualisieren des Verkaufschancenstatus
Eine Vertriebsleiterin möchte den aktuellen Status von offenen und geschlossenen Verkaufschancen nach Stufen in ihrer Vertriebspipeline erhalten. Sie können mit dem Genie Space mit natürlicher Sprache interagieren und automatisch eine Visualisierung generieren.
Die folgende GIF zeigt diese Interaktion:
Beispiel 2: Nachverfolgen der Logistik
Ein Logistikunternehmen möchte Genie Spaces nutzen, um Geschäftskundinnen und -kunden aus verschiedenen Abteilungen dabei zu helfen, operative und finanzielle Details nachzuverfolgen. Es wurde ein Genie Space eingerichtet, in dem die Leiterinnen und Leiter der Versandabteilung die Sendungen verfolgen können, und ein weiterer Bereich, in dem die Finanzverantwortlichen die finanzielle Situation des Unternehmens nachvollziehen können.
Wie Genie eine Antwort generiert
Genie verwendet ein zusammengesetztes KI-System, um Geschäftsfragen zu interpretieren und Antworten zu generieren. Anstatt ein einzelnes großes Sprachmodell zu verwenden, verarbeiten zusammengesetzte KI-Systeme Aufgaben in KI-Anwendungen, indem mehrere interagierende Komponenten kombiniert werden. Zusammengesetzte KI-Systeme sind aufgrund ihrer Leistung und Flexibilität ein zunehmend gängiges Entwurfsmuster für KI-Anwendungen. Weitere Informationen finden Sie unter The Shift from Models to Compound AI Systems.
Wenn ein Benutzer eine Frage einreicht, analysiert Genie die Anfrage, identifiziert relevante Datenquellen und bestimmt, wie er auf die Aufforderung reagiert. Die Anweisungen, die Sie in Kombination mit Unity-Katalogmetadaten bereitstellen, ermöglichen Es Genie, sowohl geschäfts- als auch technische Logik abzuleiten. Genie filtert intelligente SQL-Abfragen, Tabellen- und Spaltenmetadaten und chatverlauf, um die relevantesten Informationen zur Beantwortung der Anfrage auszuwählen.
Genie verwendet die folgenden Komponenten, um Antworten zu generieren:
- Tabellenmetadaten: Enthält Tabellennamen, Beschreibungen und definierte Primärschlüsselbeziehungen (PK) und Fremdschlüsselbeziehungen. Genie verwendet diese Daten, da sie die Anforderung analysiert und die Aufforderung für natürliche Sprache in SQL konvertiert.
- Spaltennamen und Beschreibungen: Genie filtert intelligent nach relevanten Spaltennamen und Beschreibungen, die einbezogen werden sollen.
- Beispiel-SQL-Abfragen: Genie wählt relevante SQL-Beispiele aus Anleitungenintelligent aus.
- SQL-Funktionen: Alle SQL-Funktionen, die im Bereich hinzugefügt wurden.
- Anweisungen: Die als Allgemeine Anweisungen bereitgestellten Nur-Text-Notizen sind als Kontext enthalten.
- Verlauf von Eingabeaufforderungen und Antworten: Eingabeaufforderungen und Antworten aus dem aktuellen Chat werden als Kontext einbezogen. Bei Bedarf werden aufgrund der festgelegten Tokenlimitsdie ältesten Teile des Chatprotokolls ausgeschlossen.
Hinweis
Einige Tabellendetails, z. B. der Besitzer und die Tabellengröße, sind standardmäßig nicht enthalten. Um auf diese Informationen zuzugreifen, verwenden Sie Ansichten aus dem Informationsschema, das für alle Unity-Kataloge verfügbar ist. Standardansichten könnten unnötige Details enthalten, daher kann das Erstellen einer benutzerdefinierten Ansicht darauf helfen, sich auf die benötigten spezifischen Informationen zu konzentrieren. Weitere Informationen dazu, was im Informationsschema verfügbar ist, finden Sie unter Information schema.
Wenn Genie eine Abfrage als Ergebnis zurückgibt, wird sie im angegebenen SQL-Warehouse ausgeführt. Wiederholungen werden automatisch verarbeitet, und das SQL-Lager übernimmt Parallelität und Skalierung.
Welche Daten sollte ich verwenden?
Ein Genie-Bereich kann eine oder mehrere Tabellen enthalten, die im Unity-Katalog registriert sind, einschließlich verwalteter Tabellen, externer Tabellen, Fremdtabellen, Ansichten und materialisierter Ansichten. AI/BI Genie verwendet die Metadaten, die an Unity Catalog-Objekte angefügt sind, um Antworten zu generieren. Gut kommentierte Datasets, gepaart mit spezifischen Anweisungen, die Sie bereitstellen, sind entscheidend für die Erstellung einer positiven Erfahrung für Endbenutzerinnen und Endbenutzer.
Databricks empfiehlt Folgendes:
- Zusammenstellen von Daten für den analytischen Verbrauch: Layeransichten, um die Anzahl der Spalten zu reduzieren und anwendungsspezifische Informationen hinzuzufügen, um die Antwortqualität zu erhöhen.
- Minimieren Sie die Anzahl von Tabellen und Spalten in einem Genie-Bereich: Schließen Sie nur die Tabellen und Spalten ein, die zum Beantworten von Fragen für eine bestimmte Domäne erforderlich sind. Unnötige Tabellen oder Spalten können dazu führen, dass Genie verwirrende oder falsche Antworten liefert oder eine Fehlermeldung anzeigt.
- Definieren von Primärschlüssel-Beziehungen (PK)/Fremdschlüssel (FK): Verwenden Sie Unity-Katalog, um PK/FK-Beziehungen zu definieren, damit Genie versteht, wie Ihre Daten verbunden sind.
Vertrauenswürdige Ressourcen
Vertrauenswürdige Ressourcen vermitteln eine zusätzliche Zuverlässigkeitsebene in der Genauigkeit eines Ergebnisses für eine*n Raumbenutzer*in. Wenn der genaue Text einer parametrisierten Beispielabfrage oder SQL-Funktion verwendet wird, um eine Antwort zu generieren, markiert Genie die Antwort als vertrauenswürdige Ressource. Weitere Informationen finden Sie unter Verwenden vertrauenswürdiger Ressourcen in AI/BI Genie-Bereichen.
Chatthreads
Die meisten Interaktionen mit Genie Space finden in einem Chatfenster statt. Chatthreads speichern einen Datensatz von Interaktionen für jeden Benutzer. Jeder Chat-Thread behält den Kontext zu früheren Fragen bei, die ihm gestellt wurden. Genie verwendet den Kontext im Verlauf des Chat-Threads, um zu lernen, wenn Benutzer Nachverfolgungsfragen stellen, um eine Ergebnismenge weiter zu erforschen oder neu zu fokussieren.
Benutzer mit mindestens CAN VIEW-Zugriff auf einen Bereich können ihren eigenen Chatverlauf anzeigen. Benutzer*innen, die mindestens über Berechtigungen zum Bearbeiten verfügen, können alle Fragen und Antworten auf der Registerkarte Verlauf des Raums überprüfen.
Antworten überprüfen
Die meisten Antworten enthalten eine Erklärung in natürlicher Sprache sowie eine Tabelle, die die relevante Ergebnismenge zeigt. Wenn Genie erkennt, dass eine Visualisierung die Reaktionsschärfe verbessern könnte, gibt sie auch eine Visualisierung zurück. Die genaue Antwortstruktur variiert je nach Frage. Alle Antworten enthalten die SQL-Abfrage, die generiert wurde, um die Frage zu beantworten.
Raumbenutzer und Autoren können die Antworten auf ihre Fragen überprüfen. Sie können jede Antwort mit einem Daumen nach oben oder Daumen nach unten bewerten oder eine Antwort anfordern, die überprüft werden soll. Raumbearbeiter*innen und Autor*innen können dieses Feedback mithilfe der Registerkarte Verlauf im Genie-Raum überprüfen.
Bewerten von Antworten mit Benchmarks
Benchmarks ermöglichen es Ihnen, Tests und Bewertungen einzelner Antworten in einem Genie-Raum zu skalieren. Im Gegensatz zu Anweisungen sollen Benchmarks ihren Genie-Raum bewerten, nicht informieren. Genie verwendet keine Benchmark-Fragen oder Beispiel-SQL, um den Kontext von Genie zu verbessern.
Mithilfe von Benchmarks können Sie eine Sammlung von Testfragen ausführen und die Antworten verwenden, um die Genauigkeit von Genie zu messen. Optional können Sie eine SQL-Anweisung einfügen, die die erwarteten Ergebnisse zurückgibt. Wenn die Benchmark-Frage ausgeführt wird, wird die Antwort von Genie mit den Ergebnissen der SQL-Anweisung verglichen und für die Genauigkeit bewertet. Die Frage wird zur Überprüfung markiert, wenn keine SQL-Antwort bereitgestellt wurde.
Siehe Verwenden von Benchmarks in einem Genie-Raum.
Datenschutz und Sicherheit
F: Welches Modell verwendet Genie?
Genie verwendet das Azure OpenAI-Modell.
F: Welche Daten werden an das Modell gesendet?
Genie Spaces generieren Antworten auf Fragen der natürlichen Sprache mithilfe von Metadaten und Anweisungen. Genie hat keinen Zugriff auf Daten auf Zeilenebene.
Um Antworten zu verarbeiten, verwendet Genie Folgendes:
- Die vom Benutzer übermittelte Aufforderung in natürlicher Sprache
- Tabellennamen und Beschreibungen
- Spaltentitel und Beschreibungen
- Allgemeine Anleitungen
- SQL-Beispielabfragen
- SQL-Funktionen
F: Erfasst Azure OpenAI meine Daten?
Nein Databricks hat sich für die Ausnahme von der Missbrauchsüberwachung und dem Programm für die menschliche Überprüfung entschieden, unter dem Microsoft keine Aufforderungen und Fertigstellungen speichert, die an den Azure OpenAI-Dienst gesendet werden. Weitere Informationen finden Sie in der Dokumentation von Microsoft.