Organiser un espace Genie efficace
Important
Cette fonctionnalité est disponible en préversion publique.
L’objectif de l’organisation d’un espace Genie est de créer un environnement où les utilisateurs métier peuvent poser des questions en langage naturel, et recevoir des réponses précises et cohérentes en fonction de leurs données. Les espaces Genie utilisent des modèles avancés qui génèrent des requêtes sophistiquées et comprennent les connaissances générales du monde.
La plupart des questions métier sont spécifiques à un domaine. Le rôle d’un organisateur d’espace consiste donc à combler le fossé entre ces connaissances générales et le langage spécialisé utilisé dans un domaine spécifique ou par une entreprise particulière. Les organisateurs utilisent des métadonnées et des instructions pour aider Genie à interpréter avec précision les questions des utilisateurs métier, et à y répondre. Cet article décrit les meilleures pratiques et les principes qui vous guideront dans l’élaboration d’un espace réussi.
Meilleures pratiques pour la définition d’un nouvel espace
Les sections suivantes recommandent certaines pratiques qui vous permettront de créer un espace efficace.
Démarrer petit
L’organisation d’un espace Genie est un processus itératif. Quand vous créez un espace, commencez aussi petit que possible, avec un nombre minimal d’instructions et un ensemble limité de questions auxquelles répondre. Vous pouvez ensuite ajouter des éléments au fur et à mesure de l’itération en fonction des commentaires et du monitoring. Cette approche contribue à rationaliser la création et la gestion de votre espace, et vous permet d’organiser celui-ci efficacement en réponse aux besoins réels des utilisateurs.
Suivez les recommandations ci-dessous pour créer un petit espace Genie :
- Restez concentré : incluez uniquement les tables nécessaires pour répondre aux questions que vous souhaitez traiter dans l’espace. Visez cinq tables au maximum. Plus votre sélection est ciblée, mieux c’est. L’idéal est de concentrer votre espace sur une petite quantité de données. Vous devez donc limiter le nombre de colonnes dans les tables que vous incluez.
- Prévoyez d’itérer : commencez par une configuration minimale pour votre espace, en vous concentrant sur les tables essentielles et les instructions de base. Ajoutez des conseils et des exemples plus détaillés à mesure que vous affinez l’espace au fil du temps, plutôt que de viser la perfection initialement.
- Utilisez des tables bien annotées : Genie utilise les noms et les descriptions de colonnes de Unity Catalog pour générer les réponses. Des noms et des descriptions de colonnes clairs permettent de produire des réponses de haute qualité. Les descriptions de colonnes doivent fournir des informations contextuelles précises. Évitez les détails ambigus ou inutiles. Vérifiez l’exactitude et la clarté des descriptions générées par l’IA, et utilisez-les uniquement si elles correspondent à ce que vous auriez produit manuellement.
Demander à un expert du domaine de définir l’espace
Un créateur d’espace efficace doit comprendre les données et les insights qui peuvent en être tirés. Les analyste Données qui maîtrisent le langage SQL disposent généralement des connaissances et des compétences nécessaires pour organiser l’espace.
Définir la finalité de votre espace
L’identification de l’audience et de l’objectif spécifiques de votre espace vous permet de décider des données, des instructions et des questions de test à utiliser. Un espace doit répondre à des questions relatives à un sujet et une audience spécifiques, et non à des questions générales portant sur divers domaines.
Tester et ajuster
Vous devez être le premier utilisateur de votre espace. Une fois que vous avez créé un espace, commencez à poser des questions. Examinez soigneusement le code SQL généré en réponse à vos questions. Si Genie interprète mal les données, les questions ou le jargon métier, vous pouvez intervenir en modifiant le code SQL généré ou en fournissant d’autres instructions spécifiques. Poursuivez les tests et les modifications jusqu’à ce que vous obteniez des réponses fiables.
Après avoir examiné une question, vous pouvez l’ajouter en tant que question de référence que vous pouvez utiliser pour tester et noter systématiquement votre espace pour une précision globale. Vous pouvez utiliser des variantes et différentes formulations de questions pour tester les réponses de Genie. Consultez Utiliser des points de référence dans un espace Genie.
Consultez Résolution des problèmes pour obtenir des idées sur la correction des réponses erronées.
Mener des tests utilisateur
Après avoir vérifié la qualité des réponses au travers de tests, recrutez un utilisateur métier pour essayer l’espace Genie. Suivez les recommandations ci-dessous pour faciliter le parcours utilisateur, et recueillir des commentaires dans le cadre d’une amélioration continue :
- Expliquez-à l’utilisateur que son travail consiste à contribuer à l’amélioration de l’espace.
- Demandez-lui de concentrer ses tests sur le sujet et les questions spécifiques auxquels l’espace est conçu pour répondre.
- S’ils reçoivent une réponse incorrecte, encouragez les utilisateurs à ajouter des instructions et des clarifications supplémentaires dans la conversation pour affiner la réponse. Quand une réponse correcte est fournie, ils doivent voter pour la requête finale afin de réduire les erreurs similaires dans les interactions futures.
- Demandez aux utilisateurs de voter pour ou contre les réponses à l’aide du mécanisme de commentaires intégré.
- Invitez les utilisateurs à partager des commentaires supplémentaires et des questions non résolues directement avec les auteurs de l’espace. Les auteurs et les éditeurs peuvent utiliser les commentaires pour affiner les instructions, les exemples et les ressources approuvées.
Pensez à mettre à disposition des supports de formation ou un document écrit avec des recommandations pour tester l’espace, et fournir des commentaires. Au fur et à mesure que les utilisateurs métier testent l’espace, vous voyez les questions qu’ils ont posées sous l’onglet Historique. Continuez à ajouter des instructions pour aider Genie à interpréter correctement les questions et les données afin de fournir des réponses exactes. Consultez Vérifier l’historique et les commentaires pour en savoir plus sur la surveillance des espaces Génie.
Remarque
Les utilisateurs métier doivent être membres de l’espace de travail d’origine pour pouvoir accéder à votre espace. Consultez Autorisations nécessaires pour découvrir comment fournir les autorisations appropriées afin d’interagir avec l’espace.
Dépannage
Les sections suivantes expliquent comment résoudre les problèmes courants.
Jargon métier mal compris
La plupart des entreprises ou des domaines utilisent des raccourcis spécifiques pour communiquer sur des événements spécifiques à l’entreprise. Par exemple, quand il est fait référence à une année, il peut toujours s’agir de l’année d’exercice, et cette année d’exercice peut commencer en février ou mars au lieu de janvier. Pour permettre à Genie de répondre à ces questions de manière naturelle et précise, incluez des instructions qui mappent explicitement votre jargon métier aux mots et concepts compréhensibles par Genie. Consultez Fournir des instructions.
Utilisation de tables ou de colonnes incorrectes
Si Genie tente d’extraire des données d’une table incorrecte, ou d’exécuter une analyse sur des colonnes incorrectes, vous pouvez ajuster les données de l’une des façons suivantes :
- Fournissez des descriptions claires et précises : consultez vos tables et les métadonnées associées pour vérifier que la terminologie utilisée correspond à celle des utilisateurs dans les questions soumises. Si ce n’est pas le cas, affinez la description, ou ajoutez une instruction qui mappe la terminologie utilisée dans la table à celle utilisée dans la question.
- Ajoutez des exemples de requêtes : fournissez des exemples de requêtes SQL que Genie peut utiliser pour apprendre à répondre à certaines questions. Consultez Fournir des instructions.
- Supprimez certaines tables ou colonnes de l’espace : certaines tables peuvent inclure des colonnes ou des concepts qui se chevauchent, ce qui empêche Genie de savoir quelles sont les données à utiliser dans une réponse. Si possible, supprimez les tables ou colonnes inutiles, ou qui se chevauchent. Vous pouvez éventuellement créer une vue qui inclut uniquement les colonnes nécessaires.
Filtrage des erreurs
Les requêtes générées incluent souvent une clause WHERE
pour filtrer les résultats en fonction d’une valeur spécifique. Dans la mesure où Genie n’a pas de visibilité sur les données réelles, il peut définir la clause WHERE
pour filtrer la valeur incorrecte. Par exemple, il peut tenter de trouver une correspondance au nom « Californie » quand la table utilise des abréviations telles que « CA ».
Dans ce genre de situation, essayez l’une des stratégies suivantes :
- Si l’ensemble des valeurs de colonne est raisonnablement petit, énumérez les chaînes valides pour chaque description de colonne. Placez des guillemets autour des valeurs de chaîne, en particulier si elles contiennent des espaces ou des nombres. Parfois, pour les énumérations courantes, il suffit de dire « Utilise le code ISO à trois lettres du pays » au lieu de lister chaque valeur d’état.
Jointures incorrectes
Si vous n’avez pas défini de références de clé étrangère dans votre solution Unity Catalog, votre espace risque de ne pas savoir comment les différentes tables doivent être jointes.
Essayez d’implémenter une ou plusieurs des solutions suivantes :
- Définissez des références de clé étrangère dans votre solution Unity Catalog quand cela est possible. Consultez Clause CONSTRAINT.
- Fournissez des exemples de requêtes où vous joignez des tables de manière standard.
- Si les relations de clé étrangère de vos tables ne sont pas spécifiées dans votre solution Unity Catalog, documentez-les dans les instructions.
Si aucune de ces solutions ne résout le problème, vous pouvez préjoindre la table dans une vue, puis l’utiliser en tant qu’entrée pour l’espace à la place. Cette stratégie est utile pour les scénarios de jointure plus complexes, par exemple les jointures réflexives.
Problèmes de calcul de métriques
La façon dont les métriques sont calculées et cumulées peut être arbitrairement compliquée, et englober de nombreux détails métier que votre espace ne comprend pas. Cela peut donner lieu à des rapports incorrects.
Essayez d’implémenter une ou plusieurs des solutions suivantes :
- Si vos métriques sont agrégées à partir de tables de base, fournissez des exemples de requêtes SQL calculant chaque valeur de cumul.
- Si vos métriques ont été précalculées, et si elles se trouvent dans des tables agrégées, expliquez-le dans les commentaires de la table. Spécifiez des agrégations valides pour chaque métrique, si les métriques de cette table peuvent être cumulées davantage.
- Si le code SQL que vous essayez de générer est très compliqué, essayez de créer des vues qui ont déjà agrégé vos métriques pour votre espace.
Instructions ignorées
Même si vous avez inclus des explications sur vos tables et colonnes dans les commentaires, et fourni des instructions générales, il est possible que votre espace ne les utilise pas correctement.
Essayez une ou plusieurs des stratégies suivantes :
- Fournissez des exemples de requêtes qui utilisent correctement vos tables. Les exemples de requête sont particulièrement efficaces pour enseigner à votre espace comment utiliser vos données.
- Créez des vues à partir de vos tables pour fournir une vue plus simplifiée de vos données.
- Passez en revue vos instructions, et essayez de cibler l’espace en supprimant les tables ou les instructions non pertinentes.
- Essayez de démarrer une nouvelle conversation. Les interactions précédentes peuvent influencer les réponses de Genie dans une conversation donnée. Toutefois, le démarrage d’une nouvelle conversation vous donne un point de départ vierge pour tester de nouvelles instructions.
Problèmes de performance
Quand Genie doit générer des requêtes ou des réponses textuelles exceptionnellement longues, sa réponse peut prendre beaucoup de temps, ou même expirer durant la phase de réflexion.
Essayez une ou plusieurs des actions suivantes pour améliorer les performances :
- Utilisez des ressources ou des vues approuvées pour encapsuler les requêtes complexes. Consultez Utiliser les ressources approuvées dans les espaces AI/BI Genie.
- Réduisez la longueur de vos exemples de requêtes SQL dans la mesure du possible.
- Démarrez une nouvelle conversation si Genie commence à générer des réponses lentes ou défaillantes.
Réponses non fiables à des questions stratégiques
Utilisez des ressources approuvées pour fournir des réponses vérifiées aux questions spécifiques attendues de la part des utilisateurs. Consultez Utiliser les ressources approuvées dans les espaces AI/BI Genie.
Avertissement de limite de jeton
Les jetons sont les unités de base du texte que Genie utilise pour traiter et comprendre le langage. Le texte inclus en tant qu’instructions ou métadonnées dans un espace Genie est converti en jetons. Si le nombre de jetons dans votre espace est proche de la limite, le produit vous avertit d’avertissements. Genie applique le filtrage de contexte intelligent pour sélectionner les jetons qui représentent les métadonnées et certains types d’instructions inclus dans l’espace Genie. Même si vous dépassez la limite, l’espace doit continuer à générer des réponses aux questions.
Si votre espace Génie approche de la limite de jetons, Genie peut hiérarchiser, y compris uniquement les parties de votre schéma de table et les instructions les plus pertinentes pour la question. Cela peut réduire la qualité de la réponse si le contexte important est filtré. Tenez compte des pratiques suivantes pour réduire le nombre de jetons :
- Supprimer les colonnes inutiles : Les colonnes inutiles de vos tables peuvent contribuer considérablement à l’utilisation des jetons. Créez des vues pour exclure les champs redondants ou non essentiels de vos tables brutes.
- Simplifier les descriptions des colonnes : Bien que les descriptions des colonnes soient importantes, évitez de dupliquer les informations déjà spécifiées dans les noms des colonnes. Par exemple, si une colonne est nommée
account_name
, une description telle que « nom de votre compte » peut être redondante et peut être omise. - Simplifier les instructions : Vérifiez que vos instructions sont claires et concises. Évitez les mots superflus.
- Exemples d’instructions SQL de Prune : incluez une plage variée d’instructions SQL pour couvrir différents types de questions, mais supprimez des exemples redondants ou superposés.
Votre compte n’est pas activé pour le traitement intergéographique
Genie est un service désigné géré par Azure Databricks. Les services désignés utilisent Databricks Geos pour gérer la résidence des données. Pour certaines régions, les données ne peuvent pas être traitées dans la même zone géographique que l’espace de travail. Si votre espace de travail se trouve dans l’une de ces régions, le traitement intergéographique doit être activé par votre administrateur de compte.