Herstellen einer Verbindung mit Fivetran
Die automatisierte Fivetran-Datenintegration passt sich an, wenn sich Schemas und APIs ändern, um zuverlässigen Datenzugriff und eine vereinfachte Analyse mit abfragebereiten Schemas sicherzustellen.
Sie können Ihre Databricks SQL-Warehouses (ehemals Databricks SQL-Endpunkte) und Azure Databricks-Cluster in Fivetran integrieren. Die Fivetran-Integration mit Azure Databricks hilft Ihnen, Daten aus unterschiedlichen Datenquellen in Delta Lake zu zentralisieren.
Herstellen einer Verbindung zu Fivetran über Partner Connect
In diesem Abschnitt wird beschrieben, wie Sie mithilfe von Partner Connect eine Verbindung mit Fivetran herstellen. Jeder Benutzer erstellt seine eigene Verbindung.
Hinweis
Die Benutzerverbindung befindet sich unter Public Preview. Sie können die Möglichkeit, Verbindungen pro Benutzer zu erstellen, deaktivieren, indem Sie sich an Ihr Azure Databricks-Kontoteam wenden.
Bevor Sie eine Verbindung mit Partner Connect herstellen
Bevor Sie über Partner Connect eine Verbindung mit Fivetran herstellen, stellen Sie sicher, dass Sie über Folgendes verfügen:
- Die Benutzerrolle Arbeitsbereichsadministrator oder die folgenden Berechtigungen:
- Für Daten, die von Unity Catalog verwaltet werden, gelten die folgenden Metastoreobjektberechtigungen für den Katalog, in den Fivetran schreiben soll:
USE CATALOG
undCREATE SCHEMA
im Katalog.- (Optional) Um einen Zielspeicherort anzugeben, wählen Sie CREATE EXTERNAL TABLE am externen Speicherort aus und greifen Sie auf Daten im Cloudobjektspeicher zu.
- Für Daten, die durch den Legacy-Hive-Metastore verwaltet werden, gelten die folgenden Metastoreobjektberechtigungen für den Katalog, in den Fivetran schreiben soll:
USAGE
undCREATE
im Katalog- (Optional) Um einen Zielspeicherort anzugeben, greifen Sie auf Daten im Cloudobjektspeicher zu.
Berechtigungen für Unity Catalog-Metastoreobjekte können entweder von einem Metastoreadministrator, vom Besitzer des Objekts oder vom Besitzer des Katalogs oder Schemas erteilt werden, der bzw. das das Objekt enthält. Weitere Informationen finden Sie unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte.
Berechtigungen für Legacy-Hive-Metastoreobjekte können von einem Arbeitsbereichsadministrator oder dem Besitzer des Objekts erteilt werden. Weitere Informationen finden Sie unter Hive-Metastoreberechtigungen und sicherungsfähige Objekte (Legacy).
Der Zugriff auf Daten im Cloudobjektspeicher muss von einem Arbeitsbereichsadministrator mit ausreichenden Berechtigungen im Cloudobjektspeicherkonto konfiguriert werden. Weitere Informationen finden Sie unter Aktivieren der Datenzugriffskonfiguration.
Partner Connect-Schritte
Gehen Sie wie folgt vor, um Ihren Azure Databricks-Arbeitsbereich mithilfe von Partner Connect mit Fivetran zu verbinden:
Klicken Sie auf der Randleiste auf Partner Connect.
Klicken Sie auf die Kachel Fivetran.
Mit den Schritten in diesem Abschnitt wird ein Fivetran-Testkonto auf Benutzerebene erstellt. Um sich bei einem vorhandenen Fivetran-Testkonto auf Arbeitsbereichsebene anzumelden, klicken Sie auf Vorhandene Verbindung verwenden, führen Sie die Bildschirmanweisungen zum Anmelden bei Fivetran aus, und überspringen Sie die restlichen Schritte in diesem Artikel.
Wählen Sie ein SQL-Warehouse aus. Wenn das SQL-Warehouse angehalten wurde, klicken Sie auf Starten.
Wenn Ihr Arbeitsbereich für Unity Catalog aktiviert ist, wählen Sie einen Katalog aus, in den Fivetran geschrieben werden soll, und klicken Sie dann auf Weiter.
Partner Connect generiert ein persönliches Zugriffstoken in Azure Databricks, das Ihrem Benutzer zugeordnet ist.
Klicken Sie auf Mit Fivetran verbinden.
In Ihrem Webbrowser wird eine neue Registerkarte geöffnet, auf der die Fivetran-Website angezeigt wird.
Führen Sie die Anweisungen auf dem Bildschirm auf der Fivetran-Website aus, um Ihr Testpartnerkonto zu erstellen.
Manuelles Verbinden mit Fivetran
Eine Übersicht über das Verfahren zum Herstellen einer manuellen Verbindung finden Sie in diesem YouTube-Video (ca. 2 Minuten).
Hinweis
Verwenden Sie Partner Connect, wenn Sie ein SQL-Warehouse schneller mit Fivetran verbinden möchten.
Bevor Sie eine manuelle Verbindung herstellen
Bevor Sie eine manuelle Verbindung mit Fivetran herstellen, müssen Sie über Folgendes verfügen:
Ein Cluster oder SQL-Warehouse in Ihrem Azure Databricks-Arbeitsbereich
Die Verbindungsdetails für Ihren Cluster oder Ihr SQL-Warehouse, insbesondere die Werte Serverhostname, Hafen und HTTP-Pfad
Ein persönliches Azure Databricks-Zugriffstoken oder ein Microsoft Entra ID-Token (früher Azure Active Directory). Führen Sie zum Erstellen eines persönlichen Zugriffstokens die Schritte in Azure Databricks persönliche Zugriffstoken für Arbeitsbereichsbenutzer aus.
Hinweis
Als bewährte Methode für die Sicherheit empfiehlt Databricks, dass Sie bei der Authentifizierung mit automatisierten Tools, Systemen, Skripten und Anwendungen persönliche Zugriffstoken verwenden, die zu Dienstprinzipalen und nicht zu Benutzern des Arbeitsbereichs gehören. Informationen zum Erstellen von Token für Dienstprinzipale finden Sie unter Verwalten von Token für einen Dienstprinzipal.
Tipp
Wenn die Kachel Fivetran in Partner Connect in Ihrem Arbeitsbereich mit einem Häkchen versehen ist, können Sie die Verbindungsdetails für das verbundene SQL-Warehouse abrufen, indem Sie auf die Kachel klicken und dann die Verbindungsdetails erweitern. Das persönliche Zugriffstoken ist ausgeblendet. Sie müssen ein persönliches Ersatzzugriffstoken erstellen und dann dieses neue Token eingeben, wenn Fivetran Sie dazu auffordert.
Manuelle Schritte
Gehen Sie wie folgt vor, um eine manuelle Verbindung mit Fivetran herzustellen:
Melden Sie sich bei Ihrem Fivetran-Konto an, oder erstellen Sie unter https://fivetran.com/login ein neues Fivetran-Konto.
Wichtig
Wenn Sie sich beim Fivetran-Konto Ihrer Organisation anmelden, wird möglicherweise die Seite Ziel auswählen angezeigt, auf der mindestens ein vorhandener Zieleintrag mit dem Databricks-Logo aufgeführt wird. Diese Einträge können Verbindungsdetails für Computeressourcen in Arbeitsbereichen enthalten, die von Ihrem Arbeitsbereich getrennt sind. Wenn Sie weiterhin eine dieser Verbindungen wiederverwenden möchten und der Computeressource vertrauen und Zugriff darauf haben, wählen Sie dieses Ziel aus, und fahren Sie dann mit „Nächste Schritte“ fort. Wählen Sie andernfalls ein beliebiges verfügbares Ziel aus, um diese Seite zu überspringen.
Klicken Sie auf der Seite Dashboard in Fivetran auf die Registerkarte Ziele.
Klicken Sie auf Add Destination (Ziel hinzufügen).
Geben Sie einen Zielnamen ein, und klicken Sie auf Hinzufügen.
Klicken Sie auf der Seite Fivetran is modern ELT (Fivetran ist moderner ELT-Prozess) auf Set up a connector (Connector einrichten).
Klicken Sie auf eine Datenquelle und dann auf Next (Weiter).
Befolgen Sie die Anweisungen auf dem Bildschirm im Setupleitfaden in Fivetran, um die Einrichtung des Connectors abzuschließen.
Klicken Sie auf Speichern und testen.
Klicken Sie nach erfolgreichem Test auf Fortsetzen.
Klicken Sie auf der Seite Ziel Ihrer Daten auswählen auf Databricks in Azure.
Klicken Sie auf Continue Setup (Setup fortsetzen).
Führen Sie die Anweisungen auf dem Bildschirm in Fivetran aus, um die Verbindungsdetails für Ihre vorhandene Azure Databricks-Computeressource einzugeben, insbesondere die Feldwerte Serverhostname und HTTP-Pfad sowie das zuvor generierte Token.
Klicken Sie auf Speichern und testen.
Klicken Sie nach erfolgreichem Test auf Fortsetzen.
Fahren Sie mit den nächsten Schritten fort.
Weitere Ressourcen:
Erkunden Sie eine oder mehrere der folgenden Ressourcen auf der Fivetran-Website: