Freigeben über


Was ist neu in HDInsight auf AKS? (Vorschau)

Wichtig

Azure HDInsight auf AKS wurde am 31. Januar 2025 eingestellt. Erfahren Sie mehr mit dieser Ankündigung.

Sie müssen Ihre Workloads zu Microsoft Fabric oder ein gleichwertiges Azure-Produkt migrieren, um eine abrupte Beendigung Ihrer Workloads zu vermeiden.

Wichtig

Dieses Feature befindet sich derzeit in der Vorschau. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure Previews weitere rechtliche Bestimmungen enthalten, die für Azure-Features gelten, die in der Betaversion, in der Vorschau oder auf andere Weise noch nicht in die allgemeine Verfügbarkeit veröffentlicht werden. Informationen zu dieser spezifischen Vorschau finden Sie unter Azure HDInsight auf AKS-Vorschauinformationen. Für Fragen oder Verbesserungsvorschläge senden Sie bitte eine Anfrage mit den Details an AskHDInsight und folgen Sie uns auf der Azure HDInsight Community, um weitere Updates zu erhalten.

In HDInsight auf AKS verfügen alle Clusterverwaltung und -vorgänge über systemeigene Unterstützung für Dienstverwaltung im Azure-Portal für einzelne Cluster.

In HDInsight auf AKS werden zwei neue Konzepte eingeführt:

  • Clusterpools werden zum Gruppieren und Verwalten von Clustern verwendet.
  • Cluster für Open Source-Berechnungen verwendet werden, werden sie in einem Clusterpool gehostet.

Clusterpools

HDInsight auf AKS wird auf Azure Kubernetes Service (AKS) ausgeführt. Die Ressource auf oberster Ebene ist der Clusterpool und verwaltet alle Cluster, die auf demselben AKS-Cluster ausgeführt werden. Wenn Sie einen Clusterpool erstellen, wird gleichzeitig ein zugrunde liegender AKS-Cluster erstellt, um alle Cluster im Pool zu hosten. Clusterpools sind eine logische Gruppierung von Clustern, die bei der Erstellung einer stabilen Interoperabilität über mehrere Clustertypen hinweg helfen und Es Unternehmen ermöglichen, die Cluster im selben virtuellen Netzwerk zu haben. Clusterpools bieten schnellen und kostengünstigen Zugriff auf alle Clustertypen, die bei Bedarf und im Großen und Maßstab erstellt wurden. Ein Clusterpool entspricht einem Cluster in der AKS-Infrastruktur.

Cluster

Cluster sind einzelne Open-Source-Computeworkloads wie Apache Spark, Apache Flink und Trino, die in wenigen Minuten mit voreingestellten Konfigurationen und wenigen Klicks schnell erstellt werden können. Obwohl sie auf demselben Clusterpool ausgeführt wird, kann jeder Cluster eigene Konfigurationen haben, z. B. Clustertyp, Version, Größe des virtuellen Knotens, Knotenanzahl. Cluster werden auf getrennten Computeressourcen mit eigenen DNS- und Endpunkten ausgeführt.

Features, die sich derzeit in der Vorschau befinden

In der folgenden Tabellenliste sind die Features von HDInsight auf AKS aufgeführt, die sich derzeit in der Vorschau befinden. Vorschaufeatures werden alphabetisch sortiert.

Fläche Funktionen
Grundlagen Erstellen von Pools und Clustern mithilfe des Portals, Web Secure Shell (SSH)-Unterstützung, Möglichkeit, die Anzahl der Arbeitsknoten bei der Clustererstellung auszuwählen
Lagerung Unterstützung für ADLS Gen2 Storage
Metastore Unterstützung des externen Metastores für Trino, Spark und Flink, Integration mit HDInsight
Sicherheit Unterstützung für ARM RBAC, Unterstützung für MSI-basierte Authentifizierung, Option zum Bereitstellen Clusterzugriffs für andere Benutzer
Protokollierung und Überwachung Protokollaggregation in Azure Log-Analytikfür Serverprotokolle, Cluster- und Servicemetriken über Managed Prometheus und Grafana, Unterstützung von Servermetriken im Azure Monitor, Service-Statusseite zur Überwachung der Servicegesundheit
Automatische Skalierung Lade basierte automatische Skalierungund Zeitplan basierte automatische Skalierung
Anpassen und Konfigurieren von Clustern Unterstützung für Skriptaktionen während der Clustererstellung, Unterstützung für Bibliotheksverwaltung, Dienstkonfiguration Einstellungen nach der Clustererstellung
Trino Unterstützung für Trino-Kataloge, Trino CLI Support, DBeaver Unterstützung für die Abfrageübermittlung, Hinzufügen oder Entfernen Plug-Ins und Connectors, Unterstützung für Protokollierungsabfragen Ereignisse, Unterstützung für Scanabfragestatistiken für alle Connector- im Trino-Dashboard, Unterstützung für Trino Dashboard zum Überwachen von Abfragen, Abfragezwischenspeicherung, Integration in Power BI, Integration mit Apache Superset, Redash, Unterstützung für mehrere Connectors
Flink Unterstützung für die native Flink-Web-UI, Flink-Unterstützung mit HMS für DStream, Übermitteln von Aufträgen an den Cluster mithilfe der REST-API und dem Azure-Portal, Ausführen von Programmen, die als JAR-Dateien gepackt sind, über die Flink CLI, Unterstützung für persistente Savepoints, Unterstützung für die Aktualisierung der Konfigurationsoptionen, wenn der Auftrag ausgeführt wird, Herstellen einer Verbindung mit mehreren Azure-Diensten: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Übermitteln von Aufträgen an den Cluster mithilfe der Flink CLI und CDC mit Flink.
Funke Jupyter Notebook, Unterstützung für Delta Lake 2.0, Zeppelin-Unterstützung, Unterstützung für ATS, Unterstützung für die Yarn History Server-Schnittstelle, Auftragsübermittlung über SSH, Auftragsübermittlung über SDK und Machine Learning Notebook

Roadmap der Funktionen

Merkmal Geschätzter Veröffentlichungszeitplan Status
Autoscale - Lastbasiert - Trino 1. Quartal 2024 Abgeschlossen
Shuffle-bewusste, lastenbasierte automatische Skalierung für Spark 2. Quartal 2024 Im Gange
Ortgebundenes Upgrade 2. Quartal 2024 Abgeschlossen
Unterstützung für reservierte Instanzen 2. Quartal 2024 Im Gange
MSI-basierte Authentifizierung für Metastore (SQL) 1. Quartal 2024 Im Gange
Spark 3.4 Q2 2024 Im Gange
Trino 426 1. Quartal 2024 Abgeschlossen
Ranger für RBAC 2. Quartal 2024 Im Gange
Unterstützung für den App-Modus für Flink 1. Quartal 2024 Abgeschlossen
Flink 1.17 1. Quartal 2024 Abgeschlossen
Spark ACID-Unterstützung 1. Quartal 2024 Im Gange
Konfigurierbare SKUs für Headnode, SSH 2. Quartal 2024 Im Gange
Flink-SQL-Gateway-Unterstützung 1. Quartal 2024 Abgeschlossen
Private Cluster für HDInsight auf AKS 1. Quartal 2024 Abgeschlossen
Ranger-Unterstützung für Spark SQL 4. Quartal 2024 Im Gange
Ranger ACLs auf Speicherebene 4. Quartal 2024 Im Gange
Unterstützung für One Lake als primärer Container 2. Quartal 2024 Im Gange