Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Azure Data Lake Analytics wird am 29. Februar 2024 eingestellt. Erfahren Sie mehr mit dieser Ankündigung.
Wenn Sie azure Data Lake Analytics bereits verwenden, können Sie einen Migrationsplan zu Azure Synapse Analytics für Ihre Organisation erstellen.
Microsoft hat Azure Synapse Analytics gestartet, die darauf abzielt, sowohl Datenseen als auch Data Warehouse für eine einzigartige Big Data Analytics-Erfahrung zusammenzubringen. Es hilft Ihnen, Ihre Daten zu sammeln und zu analysieren, um Datenineffizienz zu lösen und Ihre Teams bei der Zusammenarbeit zu unterstützen. Darüber hinaus ermöglicht die Integration von Synapse mit Azure Machine Learning und Power BI Organisationen eine verbesserte Fähigkeit, Einblicke aus ihren Daten zu gewinnen und maschinelles Lernen in all ihren intelligenten Apps auszuführen.
Das Dokument zeigt, wie Sie die Migration von Azure Data Lake Analytics zu Azure Synapse Analytics durchführen.
Empfohlener Ansatz
- Schritt 1: Bewerten der Bereitschaft
- Schritt 2: Vorbereiten der Migration
- Schritt 3: Migrieren von Daten und Anwendungsworkloads
- Schritt 4: Umstellung von Azure Data Lake Analytics auf Azure Synapse Analytics
Schritt 1: Bewerten der Bereitschaft
Sehen Sie sich Apache Spark auf Azure Synapse Analyticsan und verstehen Sie die wichtigsten Unterschiede von Azure Data Lake Analytics und Spark in Azure Synapse Analytics.
Gegenstand Azure Data Lake Analytics Spark on Synapse Preisgestaltung Pro Analyseeinheit -Stunde Pro vCore-Stunde Engine Azure Data Lake Analytics Apache Spark Standardprogrammierungssprache U-SQL T-SQL, Python, Scala, Spark SQL und .NET Datenquellen Azure Data Lake Storage Azure Blob Storage, Azure Data Lake Storage Überprüfen Sie den Fragebogen zur Migrationsbeurteilung und listen Sie die möglichen Risiken für die Prüfung auf.
Schritt 2: Vorbereiten der Migration
Identifizieren Sie Aufträge und Daten, die Sie migrieren möchten.
- Nutzen Sie diese Gelegenheit, um die Jobs zu bereinigen, die Sie nicht mehr benötigen. Es sei denn, Sie planen, alle Ihre Aufträge gleichzeitig zu migrieren, nehmen Sie sich diese Zeit, um logische Gruppen von Aufträgen zu identifizieren, die Sie in Phasen migrieren können.
- Werten Sie die Größe der Daten aus, und verstehen Sie das Apache Spark-Datenformat. Überprüfen Sie Ihre U-SQL-Skripte, bewerten Sie die Bemühungen zur Neufassung der Skripte und verstehen Sie das Konzept des Apache Spark-Codes.
Ermitteln Sie, welche Auswirkungen eine Migration auf Ihr Unternehmen hat. Beispielsweise, ob Sie während der Migration Ausfallzeiten leisten können.
Erstellen Sie einen Migrationsplan.
Schritt 3: Migrieren von Daten und Anwendungsworkloads
Migrieren Sie Ihre Daten von Azure Data Lake Storage Gen1 zu Azure Data Lake Storage Gen2.
Azure Data Lake Storage Gen1 wird im Februar 2024 eingestellt, finden Sie die offizielle Ankündigung. Wir empfehlen, die Daten zuerst nach Gen2 zu migrieren. Lesen Sie Grundlegendes zu Apache Spark-Datenformaten für Azure Data Lake Analytics U-SQL-Entwickler und verschieben Sie sowohl die Datei als auch die in U-SQL-Tabellen gespeicherten Daten, um sie für Azure Synapse Analytics zugänglich zu machen. Weitere Details zum Migrationshandbuch finden Sie hier.Transformieren Sie Ihre U-SQL-Skripts in Spark. Lesen Sie Grundsätzliches zu Apache Spark-Codekonzepten für Azure Data Lake Analytics U-SQL-Entwickler, um Ihre U-SQL-Skripts in Spark umzuwandeln.
Transformieren oder neu erstellen Sie Ihre Auftrags-Orchestrierungspipelines in ein neues Spark-Programm.
Schritt 4: Umstellung von Azure Data Lake Analytics zu Azure Synapse Analytics
Nachdem Sie sicher sind, dass Ihre Anwendungen und Workloads stabil sind, können Sie mit der Verwendung von Azure Synapse Analytics beginnen, um Ihre Geschäftsszenarien zu erfüllen. Deaktivieren Sie alle verbleibenden Pipelines, die in Azure Data Lake Analytics ausgeführt werden, und deaktivieren Sie Ihre Azure Data Lake Analytics-Konten.
Fragebogen zur Migrationsbeurteilung
Kategorie | Fragen | Referenz |
---|---|---|
Die Größe der Migration bewerten | Wie viele Azure Data Lake Analytics-Konten haben Sie? Wie viele Pipelines werden verwendet? Wie viele U-SQL-Skripts werden verwendet? | Je mehr Daten und Skripts migriert werden sollen, desto mehr UDO/UDF werden in Skripts verwendet, desto schwieriger ist es, zu migrieren. Die für die Migration erforderliche Zeit und Ressourcen müssen entsprechend dem Umfang des Projekts gut geplant sein. |
Datenquelle | Wie groß ist die Datenquelle? Welche Arten von Datenformaten für die Verarbeitung? | Verstehen von Apache Spark-Datenformaten für Azure Data Lake Analytics U-SQL-Entwickler |
Datenausgabe | Behalten Sie die Ausgabedaten zur späteren Verwendung bei? Wenn die Ausgabedaten in U-SQL-Tabellen gespeichert werden, wie sie behandelt werden? | Wenn die Ausgabedaten häufig verwendet und in U-SQL-Tabellen gespeichert werden, müssen Sie die Skripts ändern und die Ausgabedaten in das unterstützte Spark-Datenformat ändern. |
Datenmigration | Haben Sie den Speichermigrationsplan erstellt? | Migrieren von Azure Data Lake Storage von Gen1 zu Gen2 |
U-SQL-Skripts transformieren | Verwenden Sie UDO/UDF (.NET, Python usw.)? Wenn oben die Antwort ja ist, welche Sprache verwenden Sie in Ihrem UDO/UDF und gibt es Probleme bei der Transformation? Wird die federierte Abfrage in U-SQL genutzt? | Verstehen von Apache Spark-Codekonzepten für U-SQL-Entwickler von Azure Data Lake Analytics |