Zusammenstellen eines effektiven Genie-Bereichs
Ziel der Erstellung eines Genie-Bereichs ist es, eine Umgebung zu schaffen, in der Geschäftsbenutzer Fragen in natürlicher Sprache stellen und genaue, konsistente Antworten basierend auf ihren Daten erhalten können. Genie-Bereiche verwenden erweiterte Modelle, die anspruchsvolle Abfragen generieren und allgemeines Wissen verstehen.
Die meisten geschäftsbezogenen Fragen sind domänenspezifisch, daher besteht die Rolle eines Bereichskurators darin, die Kluft zwischen diesem allgemeinen Weltwissen und der spezialisierten Sprache zu überbrücken, die in einer bestimmten Domäne oder von einem bestimmten Unternehmen verwendet wird. Kuratoren verwenden Metadaten und Anweisungen, um Genie dabei zu helfen, Fragen von Geschäftsbenutzern genau zu interpretieren und zu beantworten. In diesem Artikel werden Best Practices und Prinzipien beschrieben, die Sie bei der Entwicklung eines erfolgreichen Bereichs unterstützen.
Best Practices zum Definieren eines neuen Bereichs
In den folgenden Abschnitten sind empfohlene Methoden zum Erstellen eines effektiven Bereichs aufgeführt.
Klein anfangen
Das Zusammenstellen eines Genie-Bereichs ist ein iterativer Prozess. Wenn Sie einen neuen Bereich erstellen, beginnen Sie so klein wie möglich, mit minimalen Anweisungen und einer begrenzten Gruppe von Fragen, die beantwortet werden sollen. Während des Durchlaufs können Sie anschließend weitere Elemente basierend auf dem Feedback und der Überwachung hinzufügen. Dieser Ansatz trägt dazu bei, das Erstellen und Verwalten Ihres Bereichs zu optimieren und es Ihnen zu ermöglichen, sie effektiv als Reaktion auf echte Benutzeranforderungen zu kuratieren.
Die folgenden Richtlinien helfen Ihnen dabei, einen kleinen Genie-Bereich zu erstellen:
- Fokussiert bleiben: Schließen Sie nur die erforderlichen Tabellen für die Beantwortung der Fragen ein, die der Bereich behandeln soll. Es sollten etwa fünf oder weniger sein. Je fokussierter Ihre Auswahl ist, desto besser. Idealerweise legen Sie den Fokus für Ihren Bereich auf kleine Datenmengen. Beschränken Sie also die Anzahl der Spalten in Ihren eingefügten Tabellen.
- Planen Sie das Durchlaufen: Beginnen Sie mit einem minimalen Setup für Ihren Platz, wobei Sie sich auf wichtige Tabellen und grundlegende Anweisungen konzentrieren. Fügen Sie detailliertere Anleitungen und Beispiele hinzu, während Sie den Raum im Laufe der Zeit verfeinern, anstatt zunächst auf Perfektion zu zielen.
- Auf gut kommentierten Tabellen aufbauen: Genie verwendet Unity Catalog-Spaltennamen und -beschreibungen, um Antworten zu generieren. Klare Spaltennamen und -beschreibungen können hochwertige Antworten begünstigen. Spaltenbeschreibungen sollten präzise kontextbezogene Informationen enthalten. Vermeiden Sie mehrdeutige oder unnötige Details. Überprüfen Sie alle KI-generierten Beschreibungen auf Richtigkeit und Klarheit, und verwenden Sie sie nur, wenn sie mit dem übereinstimmen, was Sie manuell bereitstellen würden.
Definieren des Bereichs durch einen Domänenexperten
Ein effektiver Bereichsersteller muss die Daten und die Erkenntnisse verstehen, die daraus gewonnen werden können. Datenanalysten, die über SQL-Fachwissen verfügen, verfügen in der Regel über das Wissen und die Fähigkeiten, den Bereich zusammenzustellen.
Definieren des Zwecks Ihres Bereichs
Wenn Sie die spezifische Zielgruppe und den Zweck Ihres Bereichs kennen, können Sie entscheiden, welche Daten, Anweisungen und Testfragen verwendet werden sollen. Ein Bereich sollte Fragen zu einem bestimmten Thema und für eine bestimmte Zielgruppe beantworten, nicht allgemeine Fragen in verschiedenen Bereichen.
Testen und Anpassen
Sie sollten der erste Benutzer Ihres Bereichs sein. Nachdem Sie einen neuen Bereich erstellt haben, beginnen Sie mit dem Stellen von Fragen. Überprüfen Sie sorgfältig die SQL-Daten, die als Antwort auf Ihre Fragen generiert wurden. Wenn Genie die Daten, Fragen oder den Geschäftsjargon falsch interpretiert, können Sie eingreifen, indem Sie die generierte SQL bearbeiten oder andere spezifische Anweisungen bereitstellen. Testen Sie weiter, und führen Sie Anpassungen durch, bis Sie zuverlässige Antworten erhalten.
Nachdem Sie eine Frage überprüft haben, können Sie sie als Benchmark-Frage hinzufügen, die Sie verwenden können, um Ihren Platz für die Gesamtgenauigkeit systematisch zu testen und zu ermitteln. Sie können Variationen und verschiedene Fragenausdrücke verwenden, um Genies Antworten zu testen. Siehe Verwenden von Benchmarks in einem Genie-Raum.
Informationen zum Beheben fehlerhafter Antworten finden Sie unter Problembehandlung.
Benutzertests durchführen
Nachdem Sie die Antwortqualität durch Tests überprüft haben, binden Sie einen Geschäftsbenutzer ein, um den Genie-Bereich zu testen. Verwenden Sie die folgenden Richtlinien, um eine reibungslose User Journey bereitzustellen und Feedback zur kontinuierlichen Verbesserung zu sammeln:
- Stellen Sie die Erwartungen, dass seine Aufgabe darin besteht, den Bereich zu definieren.
- Bitten Sie die Person, die Tests auf ein bestimmtes Thema und Fragen zu fokussieren, die im Bereich beantwortet werden sollen.
- Wenn eine falsche Antwort ausgegeben wird, ermutigen Sie die Benutzer, zusätzliche Anweisungen und Erläuterungen im Chat hinzufügen, um die Antwort zu verfeinern. Wenn eine richtige Antwort bereitgestellt wird, sollten sie der endgültigen Abfrage zustimmen, um ähnliche Fehler in zukünftigen Interaktionen zu minimieren.
- Bitten Sie Benutzer, den Antworten mithilfe des integrierten Feedbackmechanismus zuzustimmen oder sie abzulehnen.
- Laden Sie Benutzer ein, zusätzliches Feedback und ungelöste Fragen direkt mit den Bereichsautoren zu teilen. Autoren und Editoren können Feedback verwenden, um Anweisungen, Beispiele und vertrauenswürdige Ressourcen zu verfeinern.
Erwägen Sie, Schulungsmaterialien oder ein schriftliches Dokument mit Richtlinien zum Testen des Bereichs bereitzustellen und Feedback zu geben. Wenn Geschäftsbenutzer den Bereich testen, werden die Fragen angezeigt, die sie über die Registerkarte Verlauf gestellt haben. Fügen Sie weiterhin Anweisungen hinzu, um Genie dabei zu helfen, die Fragen und Daten korrekt zu interpretieren, um genaue Antworten zu liefern. Unter Prüfungsverlauf und Feedback erfahren Sie mehr darüber, wie Sie Genie-Räume überwachen können.
Hinweis
Geschäftsbenutzer müssen Mitglieder des ursprünglichen Arbeitsbereichs sein, um auf Bereich Raum zugreifen zu können. Unter Erforderliche Berechtigungen erfahren Sie, wie Sie die entsprechenden Berechtigungen für die Interaktion mit dem Bereich bereitstellen.
Problembehandlung
In den folgenden Abschnitten wird beschrieben, wie häufige Probleme behoben werden.
Missverstandener Geschäftsjargon
Die meisten Unternehmen oder Domänen haben einen bestimmten Jargon, um über geschäftsspezifische Ereignisse zu kommunizieren. Wenn beispielsweise über ein Jahr gesprochen wird, ist damit in der Regel ein Geschäftsjahr gemeint, und dieses Geschäftsjahr beginnt möglicherweise im Februar oder März und nicht schon im Januar. Um Genie zu ermöglichen, diese Fragen natürlich und richtig zu beantworten, binden Sie Anweisungen ein, die Ihren Geschäftsjargon explizit Begriffen und Konzepten zuordnen kann, die Genie verstehen kann. Weitere Informationen finden Sie unter Bereitstellen von Anweisungen.
Falsche Tabellen- oder Spaltenverwendung
Wenn Genie versucht, Daten aus einer falschen Tabelle abzurufen oder Analysen auf falsche Spalten auszuführen, können Sie die Daten auf eine der folgenden Arten anpassen:
- Klare und präzise Beschreibungen bereitstellen: Überprüfen Sie Ihre Tabellen und zugehörigen Metadaten, um zu überprüfen, ob die dort verwendete Terminologie mit der Terminologie der Benutzer in den eingereichten Fragen übereinstimmt. Wenn dies nicht der Fall ist, verfeinern Sie die Beschreibung, oder fügen Sie eine Anweisung hinzu, die die in der Tabelle verwendete Terminologie der in der Frage verwendeten Terminologie zuordnet.
- Beispielabfragen hinzufügen: Stellen Sie SQL-Beispielabfragen bereit, die Genie verwenden kann, um zu lernen, wie auf bestimmte Fragen reagiert werden kann. Weitere Informationen finden Sie unter Bereitstellen von Anweisungen.
- Tabellen oder Spalten aus dem Bereich entfernen: Einige Tabellen enthalten möglicherweise überlappende Spalten oder Konzepte, die es Genie erschweren, herauszufinden, welche Daten in einer Antwort verwendet werden sollen. Entfernen Sie nach Möglichkeit unnötige oder überlappende Tabellen oder Spalten. Sie sollten eine Ansicht erstellen, die nur die erforderlichen Spalten einschließen.
Filterfehler
Generierte Abfragen enthalten häufig eine WHERE
-Klausel, um Ergebnisse nach einem bestimmten Wert zu filtern. Da Genie keinen Einblick in die tatsächlichen Daten hat, wird die WHERE
-Klausel möglicherweise so festgelegt, dass nach dem falschen Wert gefiltert wird. Beispielsweise kann Genie versuchen, den Namen „California“ zuzuordnen, wenn die Tabelle Abkürzungen wie „CA“ verwendet.
Probieren Sie in solchen Situationen eine der folgenden Strategien aus:
- Wenn die Menge der Spaltenwerte relativ klein ist, listen Sie die gültigen Zeichenfolgen für jede Spaltenbeschreibung auf. Platzieren Sie Anführungszeichen um Zeichenfolgenwerte, insbesondere, wenn sie Leerzeichen oder Zahlen enthalten. Manchmal reicht es für allgemeine Enumerationen aus, zu sagen: „Verwenden den ISO-Code aus drei Buchstaben“, anstatt jeden Zustandswert aufzulisten.
Falsche Verknüpfungen
Wenn Fremdschlüsselverweise nicht in Ihrer Unity Catalog-Instanz definiert sind, weiß Ihr Bereich möglicherweise nicht, wie verschiedene Tabellen miteinander verknüpft werden können.
Versuchen Sie, eine oder mehrere der folgenden Lösungen zu implementieren:
- Definieren Sie wenn möglich Fremdschlüsselverweise in Ihrer Unity Catalog-Instanz. Weitere Informationen finden Sie unter CONSTRAINT-Klausel.
- Stellen Sie Beispielabfragen bereit, bei denen Sie Tabellen mithilfe von Standardmethoden verknüpfen.
- Wenn die Fremdschlüsselbeziehungen Ihrer Tabellen nicht in der Unity Catalog-Instanz angegeben sind, dokumentieren Sie sie in den Anweisungen.
Wenn keins dieser Probleme behoben wird, verknüpfen Sie die Tabelle vorab in einer Ansicht, und verwenden Sie diese stattdessen als Eingabe für den Bereich. Diese Strategie ist hilfreich für komplexere Joinszenarios wie Selbstjoins.
Probleme bei der Metrikberechnung
Die Art, wie Metriken berechnet werden und ein Rollup für sie ausgeführt wird, kann sehr kompliziert sein und viele Geschäftsdetails umfassen, die Ihr Bereich nicht versteht. Dies kann zu einer falschen Berichterstattung führen.
Versuchen Sie, eine oder mehrere der folgenden Lösungen zu implementieren:
- Wenn Ihre Metriken aus Basistabellen aggregiert werden, stellen Sie Beispiel-SQL-Abfragen bereit, die jeden Rollupwert berechnen.
- Wenn Ihre Metriken vorab berechnet wurden und in aggregierten Tabellen sitzen, erläutern Sie dies in Tabellenkommentaren. Geben Sie gültige Aggregationen für jede Metrik an, wenn für die Metriken in dieser Tabelle weiterhin ein Rollup durchgeführt werden kann.
- Wenn die zu generierende SQL-Datei sehr kompliziert ist, versuchen Sie, Ansichten zu erstellen, die Ihre Metriken bereits für Ihren Bereich aggregiert haben.
Ignorieren von Anweisungen
Selbst wenn Sie Ihre Tabellen und Spalten in Kommentaren erläutert und allgemeine Anweisungen bereitgestellt haben, werden sie möglicherweise immer noch nicht richtig verwendet.
Probieren Sie dann eine oder mehrere der folgenden Strategien aus:
- Stellen Sie Beispielabfragen bereit, die Ihre Tabellen richtig verwenden. Beispielabfragen sind besonders effektiv, um Ihrem Bereich zu vermitteln, wie Ihre Daten verwendet werden sollen.
- Erstellen Sie Ansichten aus Ihren Tabellen, die eine vereinfachte Ansicht Ihrer Daten bereitstellen.
- Überprüfen Sie Ihre Anweisungen, und versuchen Sie, den Bereich einzugrenzen, indem Sie irrelevante Tabellen oder Anweisungen entfernen.
- Versuchen Sie, einen neuen Chat zu starten. Frühere Interaktionen können die Antworten von Genie in einem bestimmten Chat beeinflussen, aber das Starten eines neuen Chats bietet Ihnen einen leere Vorlage zum Testen neuer Anweisungen.
Leistungsprobleme
Wenn Genie außergewöhnlich lange Abfragen oder Textantworten generieren muss, kann es eine lange Zeit dauern, bis das Tool während der Recherche reagiert, was auch zu einer Zeitüberschreitung führen kann.
Führen Sie eine oder mehrere der folgenden Aktionen aus, um die Leistung zu verbessern:
- Verwenden Sie vertrauenswürdige Ressourcen oder Ansichten, um komplexe Abfragen zu kapseln. Weitere Informationen finden Sie unter Verwenden vertrauenswürdiger Ressourcen in AI/BI Genie-Bereichen.
- Verringern Sie die Länge Ihrer SQL-Beispielabfragen, wenn möglich.
- Starten Sie einen neuen Chat, wenn Genie beginnt, langsame oder fehlerhafte Antworten zu generieren.
Unzuverlässige Antworten auf unternehmenskritische Fragen
Verwenden Sie vertrauenswürdige Ressourcen, um überprüfte Antworten auf bestimmte Fragen bereitzustellen, die von Benutzern gestellt werden. Weitere Informationen finden Sie unter Verwenden vertrauenswürdiger Ressourcen in AI/BI Genie-Bereichen.
Warnung zum Tokengrenzwert
Token sind die grundlegenden Texteinheiten, die Genie zum Verarbeiten und Verstehen der Sprache verwendet. Text, der als Anweisungen oder Metadaten in einem Genie-Raum enthalten ist, wird in Token konvertiert. Wenn sich die Anzahl der Token in Ihrem Raum dem Grenzwert nähert, benachrichtigt das Produkt Sie mit Warnungen. Genie wendet intelligente Kontextfilterung an, um die Token auszuwählen, die die Metadaten und einige Arten von Anweisungen darstellen, die im Genie-Raum enthalten sind. Auch wenn Sie den Grenzwert überschreiten, sollte der Platz weiterhin Antworten auf Fragen generieren.
Wenn Ihr Genie Space den Tokengrenzwert nähert, kann Genie priorisieren, nur die Teile Ihres Tabellenschemas und Anweisungen, die für die Frage am relevantesten sind. Dies kann die Antwortqualität verringern, wenn ein wichtiger Kontext herausgefiltert wird. Beachten Sie die folgenden Methoden zum Reduzieren der Tokenanzahl:
- Entfernen Sie unnötige Spalten: Unnötige Spalten in Ihren Tabellen können erheblich zur Tokennutzung beitragen. Erstellen Sie Ansichten, um redundante oder nicht wesentliche Felder aus den rohen Tabellen auszuschließen.
- Optimieren Sie Spaltenbeschreibungen: Spaltenbeschreibungen sind wichtig, aber vermeiden Sie das Duplizieren von Informationen, die bereits durch Spaltennamen vermittelt werden. Wenn eine Spalte beispielsweise den Namen
account_name
hat, kann eine Beschreibung wie „Name Ihres Kontos“ redundant sein und weggelassen werden. - Vereinfachen Sie Anweisungen: Überprüfen Sie, ob Ihre Anweisungen klar und präzise sind. Vermeiden Sie unnötige Wörter.
- Prune-Beispiel-SQL-Anweisungen: Schließen Sie eine Vielzahl von Beispiel-SQL-Anweisungen ein, um verschiedene Arten von Fragen abzudecken, aber überlappende oder redundante Beispiele zu entfernen.
Ihr Konto ist nicht für die geoübergreifende Verarbeitung aktiviert.
Genie ist ein von Azure Databricks verwalteter Designdienst . Bestimmte Dienste verwenden Databricks Geos, um die Datenhaltung zu verwalten. Bei einigen Regionen können Daten nicht im gleichen Geografischen Bereich wie der Arbeitsbereich verarbeitet werden. Wenn sich Ihr Arbeitsbereich in einer dieser Regionen befindet, muss die geoübergreifende Verarbeitung von Ihrem Kontoadministrator aktiviert werden.