Verbinding maken met Dataiku
Dataiku is een end-to-end AI-platform voor gegevensvoorbereiding, AutoML en MLOps. U kunt uw Databricks SQL-warehouses en Azure Databricks-clusters integreren met Dataiku.
Verbinding maken met Dataiku via Partner Connect
Notitie
Partner Connect ondersteunt alleen SQL-warehouses voor Dataiku. Als u een cluster wilt verbinden met Dataiku, maakt u handmatig verbinding met Dataiku.
Ga als volgt te werk om uw Azure Databricks-werkruimte te verbinden met Dataiku met behulp van Partner Connect:
Klik in de zijbalk op Partner Connect.
Klik op de partnertegel.
Notitie
Als de tegel Dataiku een vinkje bevat, heeft een beheerder Partner Connect al gebruikt om Dataiku te verbinden met uw werkruimte. Ga verder met stap 5. De partner gebruikt het e-mailadres voor uw Azure Databricks-account om u aan te melden bij uw bestaande Dataiku-account.
Selecteer een catalogus in de vervolgkeuzelijst en klik vervolgens op Volgende.
Notitie
Als uw werkruimte is ingeschakeld voor Unity Catalog, maar de partner geen ondersteuning biedt voor Unity Catalog met Partner Connect, wordt de standaardcatalogus van de werkruimte gebruikt. Als uw werkruimte niet is ingeschakeld voor Unity Catalog,
hive_metastore
wordt deze gebruikt.Selecteer een schema in de vervolgkeuzelijst en klik vervolgens op Toevoegen. U kunt deze stap herhalen om meerdere schema's toe te voegen.
Klik op Volgende.
Partner Connect maakt de volgende resources in uw werkruimte:
- Een Azure Databricks-service-principal met de naam
<PARTNER>_USER
. - Een persoonlijk toegangstoken van Azure Databricks dat is gekoppeld aan de
<PARTNER>_USER
service-principal.
Partner Connect verleent ook de volgende bevoegdheden aan de
<PARTNER>_USER
service-principal:- (Unity Catalog)
USE CATALOG
: vereist voor interactie met objecten in de geselecteerde catalogus. - (Unity Catalog):
USE SCHEMA
verleent de mogelijkheid om de schema's te lezen die u hebt geselecteerd. - (Unity Catalog)
CREATE SCHEMA
: verleent de mogelijkheid om schema's te maken in de geselecteerde catalogus. - (Verouderde Hive-metastore):
USAGE
vereist voor interactie met objecten binnenhive_metastore
en de geselecteerde schema's. - (Verouderde Hive-metastore):
CREATE
verleent de mogelijkheid om een schema te maken inhive_metastore
. - (Verouderde Hive-metastore) READ_METADATA: verleent de mogelijkheid om metagegevens te lezen voor de schema's die u hebt geselecteerd.
- (Verouderde Hive-metastore) SELECT: verleent de mogelijkheid om de schema's te lezen die u hebt geselecteerd.
- Een Azure Databricks-service-principal met de naam
Klik op Volgende.
In het vak E-mail wordt het e-mailadres voor uw Azure Databricks-account weergegeven. Dataiku gebruikt dit e-mailadres om u te vragen een nieuw partneraccount te maken of u aan te melden bij uw bestaande partneraccount.
Klik op Verbinding maken met Dataiku of meld u aan.
Er wordt een nieuw tabblad geopend in uw webbrowser, waarin de Dataiku-website wordt weergegeven.
Voltooi de instructies op het scherm op de Dataiku-website om uw Dataiku-proefaccount te maken of meld u aan bij uw bestaande Dataiku-account.
Handmatig verbinding maken met Dataiku
In deze sectie wordt beschreven hoe u een bestaand SQL-warehouse of -cluster in uw Azure Databricks-werkruimte handmatig verbindt met Dataiku.
Notitie
Voor Databricks SQL-warehouses kunt u verbinding maken met Dataiku met behulp van Partner Connect om de ervaring te vereenvoudigen.
Eisen
Voordat u handmatig verbinding maakt met Dataiku, hebt u het volgende nodig:
Een cluster of SQL Warehouse in uw Azure Databricks-werkruimte.
- Naslaginformatie over de rekenconfiguratie.
- Maak een SQL Warehouse.
De verbindingsgegevens voor uw cluster of SQL Warehouse, met name de serverhostnaam, poort en HTTP-padwaarden .
Een persoonlijk toegangstoken van Azure Databricks of een Microsoft Entra ID-token (voorheen Azure Active Directory).. Als u een persoonlijk toegangstoken wilt maken, volgt u de stappen in persoonlijke toegangstokens van Azure Databricks voor werkruimtegebruikers.
Notitie
Als best practice voor beveiliging, wanneer u zich verifieert met geautomatiseerde hulpprogramma's, systemen, scripts en apps, raadt Databricks u aan om persoonlijke toegangstokens te gebruiken die behoren tot service-principals in plaats van werkruimtegebruikers. Zie Tokens voor een service-principal beheren om tokens voor service-principals te maken.
Stappen om verbinding te maken
Als u handmatig verbinding wilt maken met Dataiku, volgt u Databricks in de Dataiku-documentatie.
Aanvullende bronnen
Verken de volgende Dataiku-resources: