Delen via


Een effectieve Genie-ruimte cureren

Het doel van het cureren van een Genie-ruimte is het creëren van een omgeving waarin zakelijke gebruikers vragen in natuurlijke taal kunnen stellen en nauwkeurige, consistente antwoorden kunnen ontvangen op basis van hun gegevens. Genie spaces maken gebruik van geavanceerde modellen die geavanceerde query's genereren en algemene wereldkennis begrijpen.

De meeste zakelijke vragen zijn domeinspecifiek, dus de rol van een ruimtecurator is het overbruggen van de kloof tussen die algemene wereldkennis en de gespecialiseerde taal die wordt gebruikt in een specifiek domein of door een bepaald bedrijf. Curatoren gebruiken metagegevens en instructies om Genie te helpen vragen van zakelijke gebruikers nauwkeurig te interpreteren en erop te reageren. In dit artikel vindt u een overzicht van aanbevolen procedures en principes om u te begeleiden bij het ontwikkelen van een succesvolle ruimte.

Aanbevolen procedures voor het definiëren van een nieuwe ruimte

In de volgende secties worden aanbevolen procedures voor het maken van een effectieve ruimte.

Begin klein

Het cureren van een Genie-ruimte is een iteratief proces. Wanneer u een nieuwe ruimte maakt, begint u zo klein mogelijk, met minimale instructies en een beperkte set vragen die u kunt beantwoorden. Vervolgens kunt u toevoegen terwijl u itereert op basis van feedback en controle. Deze aanpak helpt bij het stroomlijnen van het maken en onderhouden van uw ruimte en stelt u in staat om deze effectief te cureren in reactie op de behoeften van echte gebruikers.

Gebruik de volgende richtlijnen om een kleine Genie-ruimte te maken:

  • Blijf gefocust: neem alleen de tabellen op die nodig zijn om de vragen te beantwoorden die u wilt verwerken. Richt op vijf of minder tabellen. Hoe meer gericht uw selectie, hoe beter. Het beperken van uw ruimte op een kleine hoeveelheid gegevens is ideaal, dus beperk het aantal kolommen in uw opgenomen tabellen.
  • Plannen om te herhalen: Begin met een minimale installatie voor uw ruimte, waarbij u zich richt op essentiële tabellen en basisinstructies. Voeg meer gedetailleerde richtlijnen en voorbeelden toe wanneer u de ruimte na verloop van tijd verfijnt in plaats van te streven naar perfectie in eerste instantie.
  • Bouwen op goed geannoteerde tabellen: Genie maakt gebruik van kolomnamen en beschrijvingen van Unity Catalog om antwoorden te genereren. Door kolomnamen en beschrijvingen te wissen, kunt u antwoorden van hoge kwaliteit produceren. Kolombeschrijvingen moeten nauwkeurige contextuele informatie bieden. Vermijd dubbelzinnige of onnodige details. Inspecteer door AI gegenereerde beschrijvingen voor nauwkeurigheid en duidelijkheid en gebruik ze alleen als ze overeenkomen met wat u handmatig zou opgeven.

Laat een domeinexpert de ruimte definiëren

Een effectieve ruimtemaker moet inzicht krijgen in de gegevens en de inzichten die ermee kunnen worden opgehaald. Gegevensanalisten die bekwaam zijn in SQL hebben doorgaans de kennis en vaardigheden om de ruimte te cureren.

Het doel van uw ruimte definiëren

Door de specifieke doelgroep en het doel van uw ruimte te identificeren, kunt u bepalen welke gegevens, instructies en testvragen u wilt gebruiken. Een ruimte moet vragen beantwoorden voor een bepaald onderwerp en een bepaald publiek, niet algemene vragen over verschillende domeinen.

Testen en aanpassen

U moet de eerste gebruiker van uw ruimte zijn. Nadat u een nieuwe ruimte hebt gemaakt, begint u met het stellen van vragen. Bekijk zorgvuldig de SQL die is gegenereerd als antwoord op uw vragen. Als Genie de gegevens, vragen of bedrijfs jargon verkeerd interpreteert, kunt u tussenbeide komen door de gegenereerde SQL te bewerken of andere specifieke instructies op te geven. Blijf testen en bewerken totdat u betrouwbare antwoorden krijgt.

Nadat u een vraag hebt beoordeeld, kunt u deze toevoegen als een benchmarkvraag die u kunt gebruiken om uw ruimte systematisch te testen en te beoordelen op algemene nauwkeurigheid. U kunt variaties en verschillende formuleringen met vragen gebruiken om de reacties van Genie te testen. Zie Benchmarks gebruiken in een Genie-ruimte.

Zie Probleemoplossing voor ideeën over het oplossen van onjuiste antwoorden.

Gebruikerstest uitvoeren

Nadat de responskwaliteit is gecontroleerd door middel van testen, moet u een zakelijke gebruiker werven om de Genie-ruimte te proberen. Gebruik de volgende richtlijnen om een soepel gebruikerstraject te bieden en feedback te verzamelen voor doorlopende verbetering:

  • Stel verwachtingen in dat hun taak is om de ruimte te verfijnen.
  • Stel hen om hun test te richten op het specifieke onderwerp en vragen die de ruimte is ontworpen om te beantwoorden.
  • Als ze een onjuist antwoord ontvangen, moedigt u gebruikers aan om aanvullende instructies en verduidelijkingen toe te voegen in de chat om het antwoord te verfijnen. Wanneer er een correct antwoord wordt opgegeven, moeten ze de uiteindelijke query upvoten om vergelijkbare fouten in toekomstige interacties te minimaliseren.
  • Laat gebruikers antwoorden upvote of downvote met behulp van het ingebouwde feedbackmechanisme.
  • Nodig gebruikers uit om extra feedback en onopgeloste vragen rechtstreeks met de auteurs van de ruimte te delen. Auteurs en editors kunnen feedback gebruiken om instructies, voorbeelden en vertrouwde assets te verfijnen.

Overweeg trainingsmateriaal of een geschreven document met richtlijnen voor het testen van de ruimte en het geven van feedback. Wanneer zakelijke gebruikers de ruimte testen, ziet u de vragen die ze hebben gesteld op het tabblad Geschiedenis . Ga door met het toevoegen van instructies om Genie te helpen de vragen en gegevens correct te interpreteren om nauwkeurige antwoorden te geven. Zie Geschiedenis en feedback bekijken voor meer informatie over het bewaken van Genie-ruimten.

Notitie

Zakelijke gebruikers moeten lid zijn van de oorspronkelijke werkruimte om toegang te krijgen tot uw ruimte. Zie Vereiste machtigingen voor meer informatie over het opgeven van de juiste machtigingen voor interactie met de ruimte.

Probleemoplossing

In de volgende secties wordt beschreven hoe u veelvoorkomende problemen kunt oplossen.

Verkeerd begrepen bedrijfs jargon

De meeste bedrijven of domeinen hebben een specifieke afkorting die ze gebruiken om te communiceren over bedrijfsspecifieke gebeurtenissen. Als u bijvoorbeeld naar een jaar verwijst, betekent dit misschien altijd het fiscale jaar en kan dit fiscale jaar beginnen in februari of maart in plaats van januari. Om Genie in staat te stellen deze vragen natuurlijk en nauwkeurig te beantwoorden, moet u instructies opnemen die uw bedrijfsjargon expliciet toewijzen aan woorden en concepten die Genie kan begrijpen. Zie Instructies opgeven.

Onjuist tabel- of kolomgebruik

Als Genie gegevens probeert op te halen uit een onjuiste tabel of een analyse uitvoert op onjuiste kolommen, kunt u de gegevens op een van de volgende manieren aanpassen:

  • Geef duidelijke en nauwkeurige beschrijvingen op: Controleer uw tabellen en de bijbehorende metagegevens om te controleren of de terminologie die daar wordt gebruikt, overeenkomt met de terminologie van de gebruikers in ingediende vragen. Als dat niet het geval is, verfijnt u de beschrijving of voegt u een instructie toe waarmee de terminologie die in de tabel wordt gebruikt, wordt toegewezen aan de terminologie die in de vraag wordt gebruikt.
  • Voorbeeldquery's toevoegen: Geef voorbeeldquery's op die Genie kan gebruiken om te leren hoe u op bepaalde vragen kunt reageren. Zie Instructies opgeven.
  • Verwijder tabellen of kolommen uit de ruimte: sommige tabellen bevatten mogelijk overlappende kolommen of concepten die het moeilijk maken voor Genie om te weten welke gegevens in een antwoord moeten worden gebruikt. Verwijder indien mogelijk onnodige of overlappende tabellen of kolommen. Mogelijk wilt u een weergave maken die alleen de benodigde kolommen bevat.

Filterfouten

Gegenereerde query's bevatten vaak een WHERE component om resultaten te filteren op basis van een specifieke waarde. Omdat Genie geen inzicht heeft in de werkelijke gegevens, kan de WHERE component worden ingesteld om te filteren op de verkeerde waarde. Het kan bijvoorbeeld proberen om de naam 'Californië' te vinden wanneer de tabel afkortingen zoals 'CA' gebruikt.

Probeer voor dergelijke situaties een van de volgende strategieën:

  • Als de set kolomwaarden redelijk klein is, moet u de geldige tekenreeksen voor elke kolombeschrijving opsommen. Plaats aanhalingstekens rond tekenreekswaarden, met name als deze spaties of getallen bevatten. Soms is het voor veelvoorkomende opsommingen voldoende om te zeggen: "Gebruik de ISO-code van drie letters" in plaats van elke staatswaarde weer te geven.

Onjuiste joins

Als refererende-sleutelverwijzingen niet zijn gedefinieerd in uw Unity-catalogus, weet uw ruimte mogelijk niet hoe verschillende tabellen moeten worden samengevoegd.

Probeer een of meer van de volgende oplossingen te implementeren:

  • Definieer waar mogelijk refererende-sleutelverwijzingen in uw Unity-catalogus. Zie CONSTRAINT clausule.
  • Geef voorbeeldquery's op waarbij u tabellen op standaard manieren samenvoegt.
  • Als de refererende sleutelrelaties van uw tabellen niet zijn opgegeven in uw Unity Catalog, documenteert u deze in de instructies.

Als geen van deze oplossingen het probleem oplost, voegt u de tabel vooraf aan een weergave toe en gebruikt u deze als invoer voor de ruimte. Deze strategie is handig voor complexere joinscenario's, zoals self-joins.

Problemen met metrische berekeningen

De manier waarop metrische gegevens worden berekend en samengeteld, kan willekeurig ingewikkeld zijn en veel zakelijke gegevens omvatten die uw ruimte niet begrijpt. Dit kan leiden tot onjuiste rapportage.

Probeer een of meer van de volgende oplossingen te implementeren:

  • Als uw metrische gegevens worden samengevoegd vanuit basistabellen, geeft u voorbeelden van SQL-query's op die elke samengetelde waarde berekenen.
  • Als uw metrische gegevens vooraf zijn berekend en zich in geaggregeerde tabellen bevinden, moet u dit uitleggen in tabelopmerkingen. Geef geldige aggregaties op voor elke metrische waarde als de metrische gegevens in die tabel verder kunnen worden samengeteld.
  • Als de SQL die u probeert te genereren erg ingewikkeld is, kunt u weergaven maken die uw metrische gegevens al hebben samengevoegd voor uw ruimte.

Onjuiste berekeningen op basis van tijd

Genie kan mogelijk niet altijd de tijdzone afleiden die wordt weergegeven in de gegevens of de tijdzone waarin uw analyse moet worden uitgevoerd, tenzij u expliciet aanvullende richtlijnen verstrekt.

Voeg meer expliciete instructies toe over de oorspronkelijke brontijdzone, de conversiefunctie en de doeltijdzone. In de volgende voorbeelden ziet u hoe u de algemene instructies voor betrouwbaardere tijdzoneconversies kunt wijzigen:

  • Altijd tijden converteren naar een specifieke tijdzone: in dit voorbeeld wordt ervan uitgegaan dat de tijdstempel van de bron UTC is en dat u resultaten in de America/Los_Angeles tijdzone wilt opnemen. Voeg het volgende toe aan de instructies om <timezone-column> te vervangen door de juiste kolomnaam:
    • Tijdzones in de tabellen bevinden zich in UTC.
    • Converteer alle tijdzones met behulp van de volgende functie: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Niet-UTC-datum/tijdnotaties converteren naar UTC: Als de standaardtijdzone van de werkruimte is, maar gebruikers in Los Angeles vandaag moeten verwijzen naar voor een specifieke set records, voegt u het volgende toe aan de algemene instructies van de werkruimte:
    • Als u wilt verwijzen naar vandaag, gebruikt u 'date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))

Zie convert_timezone functie voor meer informatie en syntaxis.

Instructies negeren

Zelfs als u uw tabellen en kolommen in opmerkingen hebt uitgelegd en algemene instructies hebt opgegeven, is de ruimte mogelijk nog steeds niet correct.

Probeer een of meer van de volgende strategieën:

  • Geef voorbeeldquery's op die uw tabellen correct gebruiken. Voorbeeldquery's zijn met name effectief om uw ruimte te leren hoe u uw gegevens gebruikt.
  • Maak weergaven van uw tabellen die een eenvoudigere weergave van uw gegevens bieden.
  • Bekijk uw instructies en probeer de ruimte te concentreren door irrelevante tabellen of instructies te verwijderen.
  • Probeer een nieuwe chat te starten. Eerdere interacties kunnen invloed hebben op de reacties van Genie in een bepaalde chat, maar het starten van een nieuwe chat geeft u een leeg startpunt voor het testen van nieuwe instructies.

Prestatieproblemen

Wanneer Genie uitzonderlijk lange query's of tekstreacties moet genereren, kan het lang duren om te reageren of zelfs een time-out tijdens de denkfase.

Probeer een of meer van de volgende acties om de prestaties te verbeteren:

  • Gebruik vertrouwde assets of weergaven om complexe query's in te kapselen. Zie Vertrouwde assets gebruiken in AI/BI Genie-ruimten.
  • Verminder waar mogelijk de lengte van uw voorbeeldquery's voor SQL.
  • Start een nieuwe chat als Genie trage of mislukte reacties begint te genereren.

Onbetrouwbare reacties op bedrijfskritieke vragen

Gebruik vertrouwde assets om geverifieerde antwoorden te geven op specifieke vragen die gebruikers verwachten te stellen. Zie Vertrouwde assets gebruiken in AI/BI Genie-ruimten.

Waarschuwing voor tokenlimiet

Tokens zijn de basiseenheden van tekst die Genie gebruikt om taal te verwerken en te begrijpen. Tekst die is opgenomen als instructies of metagegevens in een Genie-ruimte, wordt geconverteerd naar tokens. Als het aantal tokens in uw ruimte de limiet nadert, waarschuwt het product u met waarschuwingen. Genie past slimme contextfilters toe om de tokens te selecteren die de metagegevens vertegenwoordigen en sommige typen instructies die zijn opgenomen in de Genie-ruimte. Zelfs als u de limiet overschrijdt, moet de ruimte antwoorden op vragen blijven genereren.

Als uw Genie-ruimte de tokenlimiet nadert, kan Genie prioriteit geven aan het opnemen van alleen de onderdelen van uw tabelschema en instructies die het meest relevant zijn voor de vraag. Dit kan de responskwaliteit verminderen als belangrijke context wordt uitgefilterd. Houd rekening met de volgende procedures om het aantal tokens te verminderen:

  • Overbodige kolommen verwijderen: onnodige kolommen in uw tabellen kunnen aanzienlijk bijdragen aan tokengebruik. Maak weergaven om redundante of niet-essentiële velden uit te sluiten van uw onbewerkte tabellen.
  • Stroomlijn kolombeschrijvingen: hoewel kolombeschrijvingen belangrijk zijn, vermijdt u het dupliceren van informatie die al door kolomnamen wordt overgebracht. Als een kolom bijvoorbeeld een naam account_nameheeft, kan een beschrijving zoals 'de naam van uw account' overbodig zijn en kunnen worden weggelaten.
  • Vereenvoudig de instructies: controleer of uw instructies duidelijk en beknopt zijn. Vermijd onnodige woorden.
  • Sql-instructies uit het prune-voorbeeld: neem een breed scala aan voorbeeld-SQL-instructies op om verschillende soorten vragen te behandelen, maar verwijder overlappende of redundante voorbeelden.

Uw account is niet ingeschakeld voor cross-geo-verwerking

Genie is een Designated Service die wordt beheerd door Azure Databricks. Designated Services maken gebruik van Databricks Geos voor het beheren van gegevenslocatie. Voor sommige regio's kunnen gegevens niet worden verwerkt in dezelfde geografische locatie als de werkruimte. Als uw werkruimte zich in een van deze regio's bevindt, moet cross-geo-verwerking worden ingeschakeld door uw accountbeheerder.

Doorvoerlimieten bereiken

Doorvoer voor Genie-ruimten is beperkt tot 20 vragen per minuut per werkruimte, voor alle Genie-ruimten.