Qu’est-ce qu’un espace AI/BI Genie
Cet article présente AI/BI Genie, une fonctionnalité Azure Databricks qui permet aux équipes métier d’interagir avec leurs données à l’aide du langage naturel. Il utilise l’IA générative adaptée à la terminologie et aux données de votre organisation, avec la possibilité de surveiller et d’affiner ses performances par le biais des commentaires des utilisateurs.
Vue d’ensemble
Les experts du domaine, notamment les analystes de données, configurent les espaces Genie avec des jeux de données, des exemples de requêtes et des directives textuelles afin d’aider Genie à traduire les questions professionnelles en requêtes analytiques. Une fois cette configuration effectuée, les utilisateurs métier peuvent poser des questions et générer des visualisations pour comprendre les données opérationnelles. Vous pouvez continuellement mettre à jour les connaissances sémantiques de Genie à mesure que vos données changent et que les utilisateurs posent de nouvelles questions. Pour obtenir des informations supplémentaires sur DatabricksIQ, consultez Fonctionnalités optimisées par DatabricksIQ.
AI/BI Genie sélectionne les noms et descriptions pertinents dans les tables et colonnes annotées pour convertir les questions en langage naturel en requête SQL équivalente. Ensuite, il répond avec la requête générée et la table de résultats, si possible. Si Genie ne peut pas générer de réponse, il peut poser des questions de suivi pour clarifier avant de fournir une réponse.
Exemples de cas d’utilisation
Vous pouvez créer différents espaces Génie pour servir différents publics non techniques. Les scénarios suivants décrivent deux cas d’usage possibles.
Exemple 1 : Visualiser l’état des opportunités
Un responsable des ventes souhaite obtenir l’état actuel des opportunités ouvertes et fermées par phase dans son pipeline de ventes. Il peut interagir avec l’espace Genie en utilisant du langage naturel et générer automatiquement une visualisation.
L’image gif suivante montre cette interaction :
Exemple 2 : Suivi de la logistique
Une société de logistique veut utiliser des espaces Genie pour aider les utilisateurs métier de différents départements à suivre les informations opérationnelles et financières. Ils ont mis en place un espace Genie pour que leurs gestionnaires d’installations d’expédition puissent suivre les expéditions et un autre pour que leurs cadres financiers puissent comprendre leur situation financière.
Comment Genie génère une réponse
Genie utilise un système d’IA composé pour interpréter les questions métier et générer des réponses. Au lieu d’utiliser un seul modèle de langage volumineux, les systèmes IA composés traitent les tâches dans les applications IA en combinant plusieurs composants interagissants. Les systèmes IA composés sont un modèle de conception de plus en plus courant pour les applications IA en raison de leurs performances et de leur flexibilité. Pour plus d’informations, consultez The Shift from Models to Compound AI Systems.
Lorsqu’un utilisateur envoie une question, Genie analyse la demande, identifie les sources de données pertinentes et détermine comment répondre à l’invite. Les instructions que vous fournissez, combinées avec les métadonnées du catalogue Unity, permettent à Genie de déduire à la fois la logique métier et technique. Genie filtre intelligemment des exemples de requêtes SQL, de métadonnées de table et de colonne, ainsi que l’historique des conversations pour sélectionner les informations les plus pertinentes pour répondre à la demande.
Genie utilise les composants suivants pour générer des réponses :
- Métadonnées de table: Inclut les noms de tables, les descriptions et les relations de clé primaire (PK) et de clé étrangère (FK) définies. Genie utilise ces données pour analyser la requête et convertir l’invite de langage naturel en SQL.
- Noms de colonnes et descriptions : Genie filtre intelligemment les noms de colonnes et les descriptions pertinentes à inclure.
- Exemples de requêtes SQL: Genie sélectionne intelligemment des exemples SQL pertinents dans Instructions.
- fonctions SQL: toutes les fonctions SQL qui ont été ajoutées dans l’espace.
- Instructions: les notes en texte brut fournies en tant que instructions générales sont incluses en tant que contexte.
- Historique des requêtes et des réponses: Les requêtes et les réponses de la conversation actuelle sont incluses en tant que contexte. Si nécessaire, en raison des limites des jetons , les parties les plus anciennes de l’enregistrement de conversation sont exclues.
Remarque
Certains détails de table, tels que le propriétaire et la taille de la table, ne sont pas inclus par défaut. Pour accéder à ces informations, utilisez des vues à partir du schéma d’informations disponible pour tous les catalogues catalogue Unity. Les vues par défaut peuvent inclure des détails inutiles. Par conséquent, la création d’une vue personnalisée peut vous aider à vous concentrer sur les informations spécifiques dont vous avez besoin. Pour plus d’informations sur les éléments disponibles dans le schéma d’informations, consultez schéma d’informations.
Si Genie retourne une requête en conséquence, elle s’exécute sur l’entrepôt SQL désigné. Les nouvelles tentatives sont gérées automatiquement, tandis que l’entrepôt de données SQL gère la simultanéité et la mise à l’échelle.
Quelles données dois-je utiliser ?
Un espace Génie peut inclure une ou plusieurs tables inscrites dans le catalogue Unity, notamment les tables gérées, les tables externes, les tables étrangères, les vues et les vues matérialisées. Genie AI/BI utilise les métadonnées attachées aux objets Unity Catalog pour générer des réponses. Des jeux de données annotés correctement, associés à des instructions spécifiques que vous fournissez, sont essentiels pour la création d’une expérience positive pour les utilisateurs finaux.
Databricks recommande les éléments suivants :
- Organisez les données pour une consommation analytique : organisez les vues en couches afin de réduire le nombre de colonnes et ajoutez des informations spécifiques au cas d’usage pour améliorer la qualité de la réponse.
- Réduire le nombre de tables et de colonnes dans un espace Génie: incluez uniquement les tables et colonnes nécessaires pour répondre aux questions relatives à un domaine donné. Des tables ou des colonnes inutiles peuvent amener Genie à fournir des réponses confuses ou incorrectes, ou à afficher un message d'erreur.
- Définir les relations de clé primaire (PK)/clé étrangère (FK): utilisez le catalogue Unity pour définir les relations PK/FK afin que Genie comprenne comment vos données sont connectées.
Ressources approuvées
Les actifs de confiance apportent une couche supplémentaire d’assurance quant à la précision d’un résultat pour un utilisateur spatial. Lorsque le texte exact d’une requête d’exemple paramétrable ou d’une fonction SQL est utilisé pour générer une réponse, Genie marque la réponse comme ressource approuvée. Consultez Utiliser les ressources approuvées dans les espaces AI/BI Genie.
Threads de conversation
La plupart des interactions de l’espace Genie ont lieu dans une fenêtre de conversation. Les threads de conversation enregistrent un enregistrement d’interactions pour chaque utilisateur. Chaque fil de conversation conserve le contexte des questions précédentes qui lui ont posées. Genie utilise le contexte dans l'historique des threads pour apprendre au fur et à mesure que les utilisateurs posent des questions de suivi pour approfondir la recherche ou recentrer un jeu de résultats.
Les utilisateurs disposant au moins d’un accès CAN VIEW à un espace peuvent afficher leur propre historique de conversation. Les utilisateurs disposant au moins des privilèges CAN EDIT peuvent passer en revue toutes les questions et réponses dans l’onglet Historique de l’espace.
Passer en revue les réponses
La plupart des réponses incluent une explication du langage naturel et un tableau montrant le jeu de résultats approprié. Lorsque Genie détecte qu’une visualisation peut améliorer la clarté de la réponse, elle retourne également une visualisation. La structure exacte de la réponse varie en fonction de la question. Toutes les réponses incluent la requête SQL qui a été générée pour répondre à la question.
Les utilisateurs et les auteurs de l’espace peuvent passer en revue les réponses à leurs questions. Ils peuvent évaluer chaque réponse avec un pouce vers le haut ou un pouce vers le bas ou demander une réponse à examiner. Les éditeurs d’espace et les auteurs peuvent consulter ces commentaires à l'aide d’onglet Historique dans l’espace de travail Génie.
Évaluer les réponses avec des points de référence
Les points de référence vous permettent d’effectuer un scale-up des tests et de l’évaluation des réponses individuelles dans un espace Genie. Contrairement aux instructions, les points de références sont destinés à évaluer, pas à informer, votre espace Genie. Genie n’utilise pas de questions de point de référence ou d’exemple SQL pour améliorer le contexte de Genie.
À l’aide de points de référence, vous pouvez exécuter une collection de questions de test et utiliser les réponses pour mesurer la précision de Genie. Si vous le souhaitez, vous pouvez inclure une instruction SQL qui retourne les résultats attendus. Lorsque la question de référence s’exécute, la réponse de Genie est comparée aux résultats fournis par l’instruction SQL et notée pour la précision. La question est marquée pour révision si aucune réponse SQL n’a été fournie.
Consultez Utiliser des points de référence dans un espace Genie.
Confidentialité et sécurité
Q : Quel modèle Genie utilise-t-il ?
Genie utilise le modèle Azure OpenAI.
Q : Quelles données sont envoyées au modèle ?
Les espaces génie génèrent des réponses aux questions en langage naturel à l’aide de métadonnées et d’instructions. Genie n’a pas accès aux données au niveau des lignes.
Pour traiter les réponses, Genie utilise les éléments suivants :
- Invite de langage naturel envoyée par l’utilisateur
- Noms et descriptions des tables
- Titres et descriptions des colonnes
- Instructions générales
- Exemples de requêtes SQL
- Fonctions SQL
Q : Azure OpenAI collecte-t-il mes données ?
Non. Databricks a choisi l’exemption du programme de surveillance des abus et de révision humaine, sous lequel Microsoft ne stocke pas d’invites et d’achèvements envoyés au service Azure OpenAI. Pour plus d’informations, consultez la documentation de Microsoft.