Herstellen einer Verbindung mit Dataiku
Dataiku ist eine End-to-End-KI-Plattform für Datenaufbereitung, AutoML und MLOps. Sie können Ihre Databricks SQL-Warehouses und Azure Databricks-Cluster in Dataiku integrieren.
Herstellen einer Verbindung mit Dataiku mithilfe von Partner Connect
Hinweis
Partner Connect unterstützt nur SQL-Warehouses für Dataiku. Um einen Cluster mit Dataiku zu verbinden, stellen Sie manuell eine Verbindung mit Dataiku her.
Gehen Sie wie folgt vor, um Ihren Azure Databricks-Arbeitsbereich mithilfe von Partner Connect mit Dataiku zu verbinden:
Klicken Sie in der Randleiste auf Partner Connect.
Klicken Sie auf die Schaltfläche „Partner“.
Hinweis
Wenn die Kachel „Dataiku“ ein Häkchensymbol enthält, hat ein Administrator oder eine Administratorin bereits Partner Connect verwendet, um Dataiku mit Ihrem Arbeitsbereich zu verbinden. Fahren Sie mit Schritt 5 fort. Der Partner verwendet die E-Mail-Adresse für Ihr Azure Databricks-Konto, um Sie aufzufordern, sich bei Ihrem bestehenden Dataiku-Konto anzumelden.
Wählen Sie in der Dropdownliste einen Katalog aus, und klicken Sie dann auf Weiter.
Hinweis
Wenn für Ihren Arbeitsbereich Unity Catalog aktiviert ist, der Partner Unity Catalog mit Partner Connect jedoch nicht unterstützt, wird der Standardkatalog des Arbeitsbereichs verwendet. Wenn Unity Catalog für Ihren Arbeitsbereich nicht aktiviert ist, wird
hive_metastore
verwendet.Wählen Sie in der Dropdownliste ein Schema aus, und klicken Sie dann auf Hinzufügen. Sie können diesen Schritt wiederholen, um mehrere Schemas hinzuzufügen.
Klicken Sie auf Weiter.
Partner Connect erstellt die folgenden Ressourcen in Ihrem Arbeitsbereich:
- Ein Azure Databricks-Dienstprinzipal mit dem Namen
<PARTNER>_USER
. - Ein persönliches Zugriffstoken für Azure Databricks, das dem
<PARTNER>_USER
-Dienstprinzipal zugeordnet ist.
Partner Connect gewährt dem
<PARTNER>_USER
-Dienstprinzipal außerdem die folgenden Berechtigungen:- (Unity-Katalog)
USE CATALOG
: Erforderlich für die Interaktion mit Objekten innerhalb des ausgewählten Katalogs. - (Unity Catalog)
USE SCHEMA
: Ermöglicht das Lesen der ausgewählten Schemas. - (Unity-Katalog)
CREATE SCHEMA
: Gewährt die Möglichkeit, im ausgewählten Katalog Schemas zu erstellen. - (Legacy-Hive-Metastore)
USAGE
: Erforderlich für die Interaktion mit Objekten innerhalb vonhive_metastore
und den ausgewählten Schemas. - (Legacy Hive-Metastore)
CREATE
: Ermöglicht die Erstellung eines Schemas inhive_metastore
. - (Hive-Legacymetastore) READ_METADATA: Weist die Berechtigung zum Lesen von Metadaten für die ausgewählten Schemas zu.
- (Legacy-Hive-Metastore) SELECT: Ermöglicht das Lesen der ausgewählten Schemas.
- Ein Azure Databricks-Dienstprinzipal mit dem Namen
Klicken Sie auf Weiter.
Das Feld E-Mail enthält die E-Mail-Adresse für Ihr Azure Databricks-Konto. Dataiku verwendet diese E-Mail-Adresse, um Sie aufzufordern, entweder ein neues Partner-Konto zu erstellen oder sich bei Ihrem bereits vorhandenen Partner-Konto anzumelden.
Klicken Sie auf Mit Dataiku verbinden oder Anmelden.
In Ihrem Webbrowser wird ein neuer Tab mit der Dataiku-Website geöffnet.
Führen Sie die Anweisungen auf dem Bildschirm der Dataiku-Website aus, um Ihr Dataiku-Testkonto zu erstellen oder sich bei Ihrem vorhandenen Dataiku-Konto anzumelden.
Manuelles Herstellen einer Verbindung mit Dataiku
In diesem Abschnitt wird beschrieben, wie Sie ein vorhandenes SQL-Warehouse oder einen Cluster in Ihrem Azure Databricks-Arbeitsbereich manuell mit Dataiku verbinden.
Hinweis
Für Databricks SQL-Warehouses können Sie eine Verbindung mit Dataiku herstellen, indem Sie Partner Connect verwenden, um den Vorgang zu vereinfachen.
Anforderungen
Bevor Sie manuell eine Verbindung mit Dataiku herstellen, benötigen Sie Folgendes:
Ein Cluster oder SQL-Warehouse in Ihrem Azure Databricks-Arbeitsbereich
Die Verbindungsdetails für Ihren Cluster oder Ihr SQL-Warehouse, insbesondere die Werte Serverhostname, Hafen und HTTP-Pfad
Ein persönliches Azure Databricks-Zugriffstoken oder ein Microsoft Entra ID-Token (früher Azure Active Directory). Führen Sie zum Erstellen eines persönlichen Zugriffstokens die Schritte in Azure Databricks persönliche Zugriffstoken für Arbeitsbereichsbenutzer aus.
Hinweis
Als bewährte Methode für die Sicherheit empfiehlt Databricks, dass Sie bei der Authentifizierung mit automatisierten Tools, Systemen, Skripten und Anwendungen persönliche Zugriffstoken verwenden, die zu Dienstprinzipalen und nicht zu Benutzern des Arbeitsbereichs gehören. Informationen zum Erstellen von Token für Dienstprinzipale finden Sie unter Verwalten von Token für einen Dienstprinzipal.
Schritte zum Herstellen einer Verbindung
Wenn Sie eine manuelle Verbindung mit Dataiku herstellen möchten, befolgen Sie die Anweisungen zu Databricks in der Dataiku-Dokumentation.
Zusätzliche Ressourcen
Erkunden Sie die folgenden Dataiku-Ressourcen: