Se connecter à Dataiku
Dataiku est une plateforme IA de bout en bout pour la préparation des données, l’AutoML et les MLOps. Vous pouvez intégrer vos entrepôts Databricks SQL et vos clusters Azure Databricks à Dataiku.
Se connecter à Dataiku à l’aide de Partner Connect
Remarque
Partner Connect prend en charge uniquement les entrepôts SQL pour Dataiku. Pour connecter un cluster à Dataiku, connectez-vous manuellement à Dataiku.
Pour connecter votre espace de travail Azure Databricks à Dataiku à l’aide de Partner Connect, effectuez les opérations suivantes :
Dans la barre latérale, cliquez sur Partner Connect.
Cliquez sur la vignette du partenaire.
Remarque
Si la vignette Dataiku comporte une icône en forme de coche, cela signifie qu’un administrateur a déjà utilisé Partner Connect pour connecter Dataiku à votre espace de travail. Passez à l’étape 5. Le partenaire utilise l’adresse e-mail de votre compte Azure Databricks pour vous inviter à vous connecter à votre compte Dataiku existant.
Sélectionnez un catalogue dans la liste déroulante, puis cliquez sur Suivant.
Remarque
Si votre espace de travail est activé pour Unity Catalog, mais que le partenaire ne prend pas en charge Unity Catalog avec Partner Connect, le catalogue par défaut de l’espace de travail est utilisé. Si votre espace de travail ne dispose pas d’Unity Catalog,
hive_metastore
est utilisé.Sélectionnez un schéma dans la liste déroulante, puis cliquez sur Ajouter. Vous pouvez répéter cette étape pour ajouter plusieurs schémas.
Sélectionnez Suivant.
Partner Connect crée les ressources suivantes dans votre espace de travail :
- Un principal de service Azure Databricks nommé
<PARTNER>_USER
. - Un jeton d’accès personnel Azure Databricks associé au principal de service
<PARTNER>_USER
.
Partner Connect accorde également les privilèges suivants au principal de service
<PARTNER>_USER
:- (Unity Catalog)
USE CATALOG
: nécessaire pour interagir avec les objets du catalogue sélectionné. - (Unity Catalog)
USE SCHEMA
: permet de lire les schémas que vous avez sélectionnés. - (Unity Catalog)
CREATE SCHEMA
: permet de créer des schémas dans le catalogue sélectionné. - (Metastore Hive hérité)
USAGE
: Obligatoire pour interagir avec les objets danshive_metastore
et les schémas sélectionnés. - (Metastore Hive hérité)
CREATE
: permet de créer un schéma danshive_metastore
. - (Legacy Metastore Hive) READ_METADATA : accorde la possibilité de lire les métadonnées des schémas que vous avez sélectionnés.
- (Metastore Hive hérité) SELECT : Permet de lire les schémas que vous avez sélectionnés.
- Un principal de service Azure Databricks nommé
Cliquez sur Suivant.
La zone E-mail indique l’adresse e-mail de votre compte Azure Databricks. Dataiku utilise cette adresse e-mail pour vous inviter à créer un compte de partenaire ou à vous connecter à votre compte de partenaire existant.
Cliquez sur Se connecter à Dataiku ou Se connecter.
Un nouvel onglet s’ouvre dans votre navigateur web, et affiche le site web Dataiku.
Suivez les instructions à l’écran du site web Dataiku pour créer votre compte d’essai Dataiku, ou connectez-vous à votre compte Dataiku existant.
Se connecter à Dataiku manuellement
Cette section explique comment connecter manuellement un entrepôt ou un cluster SQL existant de votre espace de travail Azure Databricks à Dataiku.
Remarque
Pour les entrepôts Databricks SQL, vous pouvez vous connecter à Dataiku à l’aide de Partner Connect afin de simplifier l’expérience.
Exigences
Avant de vous connecter manuellement à Dataiku, vous avez besoin des éléments suivants :
Un cluster ou un entrepôt SQL dans votre espace de travail Azure Databricks.
Les détails de connexion pour votre cluster ou votre entrepôt SQL, en particulier les valeurs Nom d’hôte du serveur, Port et Chemin HTTP.
Un jeton d’accès personnel Azure Databricks ou un jeton Microsoft Entra ID (anciennement Azure Active Directory). Pour créer un jeton d’accès personnel, suivez les étapes décrites dans Les jetons d’accès personnels Azure Databricks pour les utilisateurs de l’espace de travail.
Remarque
En guise de bonne pratique de sécurité, quand vous vous authentifiez avec des outils, systèmes, scripts et applications automatisés, Databricks recommande d’utiliser des jetons d’accès personnels appartenant à des principaux de service et non des utilisateurs de l’espace de travail. Pour créer des jetons d’accès pour des principaux de service, consultez la section Gérer les jetons pour un principal de service.
Étapes de connexion
Pour vous connecter manuellement à Dataiku, consultez Databricks dans la documentation Dataiku.
Ressources supplémentaires
Explorez les ressources Dataiku suivantes :