Fabric Runtime 1.1 (EOSA)
Die Microsoft Fabric Runtime ist eine in Azure integrierte Plattform, die auf Apache Spark basiert und die Ausführung und Verwaltung von Datentechnik- und Data Science-Umgebungen in Fabric ermöglicht. In diesem Dokument werden die Fabric Runtime 1.1-Komponenten und -Versionen behandelt.
Warnung
Das Ende des Supporttermins für Runtime 1.1 wurde für den 12. Juli 2024 angekündigt. Runtime 1.1 basierend auf Apache Spark 3.3 wird ab dem 31. März 2025 als veraltet angesehen und deaktiviert. Aktualisieren Sie Ihren Arbeitsbereich und Ihre Umgebungen auf Runtime 1.2 oder Runtime 1.3. Den vollständigen Lebenszyklus und die Supportrichtlinien für Apache Spark-Runtimes in Fabric finden Sie unter Lebenszyklus von Apache Spark-Runtimes in Fabric.
Microsoft Fabric Runtime 1.1 ist eine der Runtimes, die auf der Microsoft Fabric-Plattform angeboten wird. Dies sind die Hauptkomponenten von Runtime 1.1:
- Apache Spark 3.3
- Betriebssystem: Ubuntu 18.04
- Java: 1.8.0_282
- Scala: 2.12.15
- Python: 3.10
- Delta Lake: 2.2
- R: 4.2.2
Tipp
Verwenden Sie immer die neueste GA-Laufzeitversion für Ihre Produktionsworkloads, die derzeit Runtime 1.3 ist.
Microsoft Fabric Runtime 1.1 enthält eine Sammlung von Paketen auf Standardebene, einschließlich einer vollständigen Anaconda-Installation und häufig verwendeter Bibliotheken für Java/Scala, Python und R. Diese Bibliotheken werden automatisch einbezogen, wenn Notebooks oder Aufträge auf der Microsoft Fabric-Plattform verwendet werden. Eine vollständige Liste der Bibliotheken finden Sie in der Dokumentation.
Microsoft Fabric veröffentlicht regelmäßig Wartungsupdates für Runtime 1.1, die Fehlerbehebungen, Leistungsverbesserungen und Sicherheitspatches bieten. Mit diesen Updates stellen Sie sicher, dass Sie immer auf dem neuesten Stand sind und profitieren von einer optimalen Leistung und Zuverlässigkeit für Ihre Datenverarbeitungsaufgaben. Wenn Sie derzeit Runtime 1.1 verwenden, können Sie ein Upgrade auf Runtime 1.3 oder auf Runtime 1.2 durchführen, indem Sie zu Arbeitsbereichseinstellungen > Technische Fachkraft für Daten ing/Science > Spark Settings > Environment navigieren.
Neue Funktionen und Verbesserungen – Apache Spark 3.3.1
Lesen Sie die Vollversion der Versionshinweise für eine bestimmte Apache Spark-Version, indem Sie sowohl Spark 3.3.0 als auch Spark 3.3.1 besuchen.
Neue Funktionen und Verbesserungen – Delta Lake 2.2
Überprüfen Sie die Quell- und vollständigen Versionshinweise unter Delta Lake 2.2.0.
Pakete auf Standardebene für Java/Scala
Eine Liste aller Standardebenenpakete für Java, Scala, Python und ihre jeweiligen Versionen finden Sie in den Versionshinweisen.
Migration zwischen verschiedenen Apache Spark-Versionen
Das Migrieren Ihrer Workloads zu Fabric Runtime 1.1 (Apache Spark 3.3) von einer älteren Version von Apache Spark umfasst eine Reihe von Schritten, um eine reibungslose Migration sicherzustellen. In diesem Leitfaden werden die erforderlichen Schritte beschrieben, die Sie bei der effizienten und effektiven Migration unterstützen.
Lesen Sie die Versionshinweise zur Fabric-Runtime 1.1, einschließlich einer Überprüfung der enthaltenen Komponenten und Pakete auf Standardebene in der Runtime zum Verständnis der neuen Features und Verbesserungen.
Überprüfen Sie die Kompatibilität Ihres aktuellen Setups und aller zugehörigen Bibliotheken, einschließlich Abhängigkeiten und Integrationen. Lesen Sie die Migrationsleitfäden, um potenzielle Breaking Changes zu identifizieren:
- Lesen Sie den Leitfaden zur Spark Core-Migration.
- Arbeiten Sie den Migrationsleitfaden zu SQL, Datasets und DataFrame durch.
- Wenn Ihre Lösung im Zusammenhang mit Apache Spark-Strukturstreaming steht, lesen Sie den Leitfaden zur Migration von strukturiertem Streaming.
- Wenn Sie PySpark verwenden, lesen Sie die Anleitung zur PySpark-Migration.
- Wenn Sie Code von Koalas zu PySpark migrieren, lesen Sie den Leitfaden zum Migrieren von Koalas zur Pandas-API in Spark.
Verschieben Sie Ihre Workloads nach Fabric, und vergewissern Sie sich, dass Sie über Sicherungen Ihrer Daten und Konfigurationsdateien verfügen, falls Sie zur vorherigen Version zurückkehren müssen.
Aktualisieren Sie alle Abhängigkeiten, auf die sich die neue Version von Apache Spark oder andere Komponenten der Fabric-Runtime 1.1 auswirken können, einschließlich Bibliotheken und Connectors von Drittanbietern. Achten Sie darauf, die aktualisierten Abhängigkeiten in einer Stagingumgebung zu testen, bevor Sie sie in der Produktion bereitstellen.
Aktualisieren Sie die Apache Spark-Konfiguration in Ihrer Workload, einschließlich Aktualisieren von Konfigurationseinstellungen, Anpassen von Speicherzuordnungen und Ändern veralteter Konfigurationen.
Ändern Sie Ihre Apache Spark-Anwendungen (Notebooks und Apache Spark-Auftragsdefinitionen), um die neuen APIs und Features zu verwenden, die mit Fabric Runtime 1.1 und Apache Spark 3.3 eingeführt werden. Möglicherweise müssen Sie Ihren Code für veraltete oder entfernte APIs aktualisieren und Ihre Anwendungen umgestalten, um von Leistungsverbesserungen und neuen Funktionen zu profitieren.
Testen Sie Ihre aktualisierten Anwendungen gründlich in einer Stagingumgebung, um Kompatibilität und Stabilität mit Apache Spark 3.3 sicherzustellen. Führen Sie Leistungstests, Funktionstests und Regressionstests durch, um Probleme zu identifizieren und zu beheben, die während des Migrationsprozesses auftreten können.
Nachdem Sie Ihre Anwendungen in einer Stagingumgebung überprüft haben, stellen Sie die aktualisierten Anwendungen in Ihrer Produktionsumgebung bereit. Überwachen Sie die Leistung und Stabilität Ihrer Anwendungen nach der Migration, um Probleme zu identifizieren, die behoben werden müssen.
Aktualisieren Sie Ihre interne Dokumentation und die Schulungsmaterialien, um die in Fabric Runtime 1.1 eingeführten Änderungen widerzuspiegeln. Stellen Sie sicher, dass Ihre Teammitglieder mit den neuen Features und Verbesserungen vertraut sind, um die Vorteile der Migration zu maximieren.