Udostępnij za pośrednictwem


Curate an effective Genie space (Curate an effective Genie space)

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

Celem curating a Genie space jest utworzenie środowiska, w którym użytkownicy biznesowi mogą stanowić pytania w języku naturalnym i otrzymywać dokładne, spójne odpowiedzi na podstawie ich danych. Miejsca genie używają zaawansowanych modeli, które generują zaawansowane zapytania i rozumieją ogólną wiedzę na temat świata.

Większość pytań biznesowych jest specyficznych dla domeny, więc rolą kuratora przestrzeni jest wypełnienie luki między ogólną wiedzą na świecie a wyspecjalizowanym językiem używanym w określonej domenie lub przez określoną firmę. Kuratorzy używają metadanych i instrukcji, aby pomóc Genie dokładnie interpretować pytania użytkowników biznesowych i odpowiadać na nie. W tym artykule opisano najlepsze rozwiązania i zasady, które ułatwiają opracowywanie udanej przestrzeni.

Najlepsze rozwiązania dotyczące definiowania nowego miejsca

W poniższych sekcjach zalecane są rozwiązania dotyczące tworzenia efektywnej przestrzeni.

Rozpocznij od małej

Curating a Genie space is an iterative process (Curating a Genie space is an iterative process). Podczas tworzenia nowego miejsca zacznij od jak najmniejszego, z minimalnymi instrukcjami i ograniczonym zestawem pytań, na które można odpowiedzieć. Następnie możesz dodać ją w miarę iteracji na podstawie opinii i monitorowania. Takie podejście pomaga usprawnić tworzenie i utrzymywanie przestrzeni oraz umożliwia efektywne zarządzanie nią w odpowiedzi na rzeczywiste potrzeby użytkowników.

Skorzystaj z poniższych wskazówek, aby pomóc w utworzeniu małej przestrzeni Genie:

  • Bądź skoncentrowany: uwzględnij tylko tabele niezbędne do udzielenia odpowiedzi na pytania, które mają być obsługiwane przez przestrzeń. Celem jest pięć lub mniej tabel. Tym bardziej koncentrujesz się na wyborze, tym lepiej. Utrzymywanie miejsca wąsko skoncentrowanego na niewielkiej ilości danych jest idealne, więc ogranicz liczbę kolumn w dołączonych tabelach.
  • Zaplanuj iterację: zacznij od minimalnej konfiguracji dla miejsca, koncentrując się na podstawowych tabelach i podstawowych instrukcjach. Dodaj bardziej szczegółowe wskazówki i przykłady w miarę uściślinia przestrzeni w czasie, zamiast dążyć do doskonałości.
  • Kompiluj na dobrze adnotacjach tabel: Usługa Genie używa nazw kolumn i opisów wykazu aparatu Unity do generowania odpowiedzi. Wyczyść nazwy kolumn i opisy ułatwiają tworzenie odpowiedzi wysokiej jakości. Opisy kolumn powinny zawierać dokładne informacje kontekstowe. Unikaj niejednoznacznych lub niepotrzebnych szczegółów. Sprawdź wszystkie opisy generowane przez sztuczną inteligencję pod kątem dokładności i jasności i używaj ich tylko wtedy, gdy są one zgodne z tym, co należy podać ręcznie.

Posiadanie eksperta w dziedzinie definiowania przestrzeni

Skuteczny twórca przestrzeni musi zrozumieć dane i szczegółowe informacje, które można z niego zebrać. Analitycy danych, którzy są biegłi w języku SQL, zwykle mają wiedzę i umiejętności w celu curate the space.

Definiowanie przeznaczenia miejsca

Zidentyfikowanie określonej grupy odbiorców i celu twojej przestrzeni pomaga zdecydować, które dane, instrukcje i pytania testowe mają być używane. Obszar powinien odpowiadać na pytania dotyczące określonego tematu i odbiorców, a nie pytania ogólne w różnych domenach.

Testowanie i dostosowywanie

Musisz być pierwszym użytkownikiem miejsca. Po utworzeniu nowego miejsca rozpocznij zadawanie pytań. Dokładnie sprawdź kod SQL wygenerowany w odpowiedzi na pytania. Jeśli Genie błędnie interpretuje dane, pytania lub żargon biznesowy, możesz interweniować, edytując wygenerowany język SQL lub podając inne szczegółowe instrukcje. Kontynuuj testowanie i edytowanie, dopóki nie otrzymasz niezawodnych odpowiedzi.

Po przejrzeniu pytania możesz dodać je jako pytanie porównawcze, którego można użyć do systematycznego testowania i oceniania miejsca w celu uzyskania ogólnej dokładności. Możesz użyć odmian i różnych fraz pytań, aby przetestować odpowiedzi Genie. Zobacz Use benchmarks in a Genie space (Używanie testów porównawczych w przestrzeni Genie).

Zobacz Rozwiązywanie problemów z pomysłami dotyczącymi naprawiania błędnych odpowiedzi.

Przeprowadź testy użytkowników

Po zweryfikowaniu jakości odpowiedzi za pomocą testowania zweryfikuj użytkownika biznesowego, aby wypróbować przestrzeń Genie. Skorzystaj z poniższych wskazówek, aby zapewnić płynną podróż użytkownika i zebrać opinie na temat ciągłej poprawy:

  • Określ oczekiwania, że ich zadaniem jest pomoc w uściśleniu pokoju.
  • Poproś ich o skupienie się na testach dotyczących konkretnego tematu i pytaniach, na które ma odpowiedzieć przestrzeń.
  • Jeśli otrzymają niepoprawną odpowiedź, zachęcamy użytkowników do dodawania dodatkowych instrukcji i wyjaśnień na czacie w celu uściślenia odpowiedzi. Po podaniu poprawnej odpowiedzi powinny one wywołać ostateczne zapytanie, aby zminimalizować podobne błędy w przyszłych interakcjach.
  • Poinformuj użytkowników o wywołaniu lub obniżeniu odpowiedzi przy użyciu wbudowanego mechanizmu przesyłania opinii.
  • Zaproś użytkowników, aby podzielili się dodatkowymi opiniami i nierozwiązanymi pytaniami bezpośrednio z autorami przestrzeni. Autorzy i redaktorzy mogą używać opinii do uściślenia instrukcji, przykładów i zaufanych zasobów.

Rozważ dostarczenie materiałów szkoleniowych lub pisemnego dokumentu z wytycznymi dotyczącymi testowania pokoju i przekazywania opinii. Gdy użytkownicy biznesowi testują przestrzeń, zobaczysz pytania, które zadawali na karcie Historia . Kontynuuj dodawanie instrukcji, aby pomóc Genie poprawnie interpretować pytania i dane, aby zapewnić dokładne odpowiedzi. Zobacz Przeglądanie historii i opinii , aby dowiedzieć się więcej na temat monitorowania przestrzeni Genie.

Uwaga

Użytkownicy biznesowi muszą być członkami źródłowego obszaru roboczego, aby uzyskać dostęp do miejsca. Zobacz Wymagane uprawnienia , aby dowiedzieć się, jak zapewnić odpowiednie uprawnienia do interakcji z przestrzenią.

Rozwiązywanie problemów

W poniższych sekcjach opisano sposób rozwiązywania typowych problemów.

Niezrozumiany żargon biznesowy

Większość firm lub domen ma określone skróty, których używają do komunikowania się z wydarzeniami specyficznymi dla firmy. Na przykład w przypadku odwoływania się do roku może to zawsze oznaczać rok obrachunkowy, a ten rok obrachunkowy może rozpoczynać się w lutym lub marcu zamiast stycznia. Aby umożliwić Genie odpowiedź na te pytania naturalnie i dokładnie, dołącz instrukcje, które jawnie mapować żargon biznesowy na słowa i pojęcia Genie może zrozumieć. Zobacz Zapewnianie instrukcji.

Nieprawidłowe użycie tabeli lub kolumny

Jeśli usługa Genie próbuje ściągnąć dane z nieprawidłowej tabeli lub uruchomić analizę nieprawidłowych kolumn, możesz dostosować dane w jeden z następujących sposobów:

  • Podaj jasne i dokładne opisy: Sprawdź tabele i skojarzone metadane, aby sprawdzić, czy używana terminologia jest zgodna z terminologią użytkowników w przesłanych pytaniach. Jeśli tak nie jest, uściślij opis lub dodaj instrukcję, która mapuje terminologię używaną w tabeli do terminologii używanej w pytaniu.
  • Dodaj przykładowe zapytania: podaj przykładowe zapytania SQL, których usługa Genie może użyć, aby dowiedzieć się, jak odpowiedzieć na określone pytania. Zobacz Zapewnianie instrukcji.
  • Usuwanie tabel lub kolumn z przestrzeni: niektóre tabele mogą zawierać nakładające się kolumny lub pojęcia, które utrudniają genie poznanie, które dane mają być używane w odpowiedzi. Jeśli to możliwe, usuń niepotrzebne lub nakładające się tabele lub kolumny. Możesz utworzyć widok zawierający tylko niezbędne kolumny.

Błędy filtrowania

Wygenerowane zapytania często zawierają klauzulę filtrowania WHERE wyników zgodnie z określoną wartością. Ponieważ Usługa Genie nie ma wglądu w rzeczywiste dane, może ustawić klauzulę WHERE , aby filtrować nieprawidłową wartość. Na przykład może próbować dopasować nazwę "California", gdy w tabeli są używane skróty, takie jak "CA".

W takich sytuacjach wypróbuj jedną z następujących strategii:

  • Jeśli zestaw wartości kolumn jest dość mały, wylicz prawidłowe ciągi dla każdego opisu kolumny. Umieść znaki cudzysłowu wokół wartości ciągów, zwłaszcza jeśli mają spacje lub liczby. Czasami w przypadku typowych wyliczeń wystarczy powiedzieć: "Użyj trzyliterowego kodu ISO kraju" zamiast wyświetlania każdej wartości stanu.

Nieprawidłowe sprzężenia

Jeśli odwołania do klucza obcego nie są zdefiniowane w katalogu aparatu Unity, miejsce może nie wiedzieć, jak różne tabele powinny być połączone.

Spróbuj zaimplementować co najmniej jedno z następujących rozwiązań:

  • Zdefiniuj odwołania do kluczy obcych w katalogu aparatu Unity, jeśli to możliwe. Zobacz klauzulę CONSTRAINT.
  • Podaj przykładowe zapytania, w których łączysz tabele w standardowy sposób.
  • Jeśli relacje kluczy obcych tabel nie są określone w katalogu aparatu Unity, udomentuj je w instrukcjach.

Jeśli żaden z tych elementów nie rozwiąże problemu, należy wstępnie dołączyć tabelę do widoku i użyć go jako danych wejściowych dla miejsca. Ta strategia jest przydatna w przypadku bardziej złożonych scenariuszy sprzężenia, takich jak sprzężenia samodzielne.

Problemy z obliczeniami metryk

Sposób, w jaki metryki są obliczane i zwijane, może być arbitralnie skomplikowany i obejmować wiele szczegółów biznesowych, które nie rozumie twoja przestrzeń. Może to prowadzić do nieprawidłowego raportowania.

Spróbuj zaimplementować co najmniej jedno z następujących rozwiązań:

  • Jeśli metryki są agregowane z tabel bazowych, podaj przykładowe zapytania SQL obliczeniowe dla każdej wartości zbiorczej.
  • Jeśli metryki zostały wstępnie obliczone i znajdują się w zagregowanych tabelach, wyjaśnij to w komentarzach tabeli. Określ prawidłowe agregacje dla każdej metryki, jeśli metryki w tej tabeli mogą być dodatkowo rzutowane.
  • Jeśli język SQL, który próbujesz wygenerować, jest bardzo skomplikowany, spróbuj utworzyć widoki, które już zagregowały metryki dla miejsca.

Ignorowanie instrukcji

Nawet jeśli wyjaśniono tabele i kolumny w komentarzach i podano ogólne instrukcje, miejsce może nadal nie używać ich poprawnie.

Wypróbuj co najmniej jedną z następujących strategii:

  • Podaj przykładowe zapytania, które prawidłowo używają tabel. Przykładowe zapytania są szczególnie skuteczne w przypadku nauczania przestrzeni, w jaki sposób korzystać z danych.
  • Utwórz widoki na podstawie tabel, które zapewniają bardziej uproszczony widok danych.
  • Przejrzyj instrukcje i spróbuj skupić się na przestrzeni, usuwając nieistotne tabele lub instrukcje.
  • Spróbuj uruchomić nowy czat. Poprzednie interakcje mogą mieć wpływ na odpowiedzi Genie w danym czacie, ale rozpoczęcie nowego czatu daje pusty punkt wyjścia do testowania nowych instrukcji.

Problemy z wydajnością

Gdy Usługa Genie musi wygenerować wyjątkowo długie zapytania lub odpowiedzi tekstowe, może upłynąć dużo czasu, aby reagować, a nawet przekraczać limit czasu w fazie myślenia.

Spróbuj wykonać co najmniej jedną z następujących akcji, aby zwiększyć wydajność:

Zawodne odpowiedzi na pytania o znaczeniu krytycznym

Użyj zaufanych zasobów, aby podać zweryfikowane odpowiedzi na konkretne pytania, których oczekujesz od użytkowników. Zobacz Use trusted assets in AI/BI Genie spaces (Używanie zaufanych zasobów w przestrzeniach usługi AI/BI Genie).

Ostrzeżenie dotyczące limitu tokenu

Tokeny to podstawowe jednostki tekstu używane przez genie do przetwarzania i zrozumienia języka. Tekst dołączony jako instrukcje lub metadane w obszarze Genie jest konwertowany na tokeny. Jeśli liczba tokenów w twoim obszarze zbliża się do limitu, produkt powiadamia Cię o ostrzeżeniach. Genie stosuje inteligentne filtrowanie kontekstowe, aby wybrać tokeny reprezentujące metadane i niektóre typy instrukcji zawartych w przestrzeni Genie. Nawet jeśli przekroczysz limit, przestrzeń powinna nadal generować odpowiedzi na pytania.

Jeśli obszar Genie zbliża się do limitu tokenów, Genie może określić priorytety, w tym tylko części schematu tabeli i instrukcje, które są najbardziej istotne dla pytania. Może to zmniejszyć jakość odpowiedzi, jeśli ważny kontekst zostanie odfiltrowany. Rozważ następujące rozwiązania, aby zmniejszyć liczbę tokenów:

  • Usuwanie niepotrzebnych kolumn: niepotrzebne kolumny w tabelach mogą znacząco przyczynić się do użycia tokenów. Tworzenie widoków w celu wykluczenia nadmiarowych lub nieistotnych pól z nieprzetworzonych tabel.
  • Usprawnij opisy kolumn: Chociaż opisy kolumn są ważne, unikaj duplikowania informacji już przekazywanych według nazw kolumn. Jeśli na przykład kolumna ma nazwę account_name, opis taki jak "nazwa konta" może być nadmiarowy i można go pominąć.
  • Upraszczanie instrukcji: Sprawdź, czy instrukcje są jasne i zwięzłe. Unikaj niepotrzebnych słów.
  • Przykładowe instrukcje języka SQL w języku Prune: uwzględnij zróżnicowany zakres przykładowych instrukcji SQL, aby uwzględnić różne typy pytań, ale usunąć nakładające się lub nadmiarowe przykłady.

Twoje konto nie jest włączone do przetwarzania krzyżowego

Genie to wyznaczona usługa zarządzana przez usługę Azure Databricks. Wyznaczone usługi używają usługi Databricks Geos do zarządzania miejscem przechowywania danych. W przypadku niektórych regionów nie można przetworzyć danych w tym samym obszarze geograficznym co obszar roboczy. Jeśli obszar roboczy znajduje się w jednym z tych regionów, przetwarzanie krzyżowe musi być włączone przez administratora konta.