Freigeben über


Einführung in den Clusterspeicher

Wichtig

Azure HDInsight auf AKS wurde am 31. Januar 2025 eingestellt. Erfahren Sie mehr mit dieser Ankündigung.

Sie müssen Ihre Workloads zu Microsoft Fabric oder ein gleichwertiges Azure-Produkt migrieren, um eine abrupte Beendigung Ihrer Workloads zu vermeiden.

Wichtig

Dieses Feature befindet sich derzeit in der Vorschau. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure Previews weitere rechtliche Bestimmungen enthalten, die für Azure-Features gelten, die in der Betaversion, in der Vorschau oder auf andere Weise noch nicht in die allgemeine Verfügbarkeit veröffentlicht werden. Informationen zu dieser spezifischen Vorschau finden Sie unter Azure HDInsight auf AKS-Vorschauinformationen. Für Fragen oder Funktionsvorschläge senden Sie bitte eine Anfrage auf AskHDInsight einschließlich der Details und folgen Sie uns für weitere Updates zur Azure HDInsight Community.

Azure HDInsight auf AKS kann nahtlos in Azure Storage integriert werden, was eine allgemeine Speicherlösung ist, die gut mit vielen anderen Azure-Diensten funktioniert. Azure Data Lake Storage Gen2 (ADLS Gen 2) ist das Standarddateisystem für die Cluster.

Das Speicherkonto kann als Standardspeicherort für Daten, Clusterprotokolle und andere Ausgaben verwendet werden, die während des Clustervorgangs generiert werden. Es kann auch ein Standardspeicher für den Hive-Katalog sein, der vom Clustertyp abhängt.

Weitere Informationen finden Sie unter Einführung in Azure Data Lake Storage Gen2.

Verwaltete Identitäten für den sicheren Dateizugriff

Azure HDInsight auf AKS verwendet verwaltete Identitäten (MSI), um den Clusterzugriff auf Dateien in Azure Data Lake Storage Gen2 zu sichern. Verwaltete Identität ist ein Feature von Microsoft Entra-ID, das Azure-Dienste mit einer Reihe automatisch verwalteter Anmeldeinformationen bereitstellt. Diese Anmeldeinformationen können verwendet werden, um sich bei jedem Dienst zu authentifizieren, der die Active Directory-Authentifizierung unterstützt. Darüber hinaus erfordern verwaltete Identitäten keine Speicherung von Anmeldeinformationen in Code- oder Konfigurationsdateien.

Wenn Sie in Azure HDInsight auf AKS während der Clustererstellung eine verwaltete Identität und Speicher auswählen, kann die verwaltete Identität nahtlos mit dem Speicher für die Datenverwaltung arbeiten, vorausgesetzt, die Rolle „Storage Blob Data Owner“ () ist der vom Benutzer zugewiesenen MSI () zugeordnet.

In der folgenden Tabelle werden die unterstützten Speicheroptionen für Azure HDInsight auf AKS (öffentliche Vorschau) beschrieben:

Clustertyp Unterstützter Speicher Verbindung Rolle im Speicher
Trino, Apache Flink und Apache Spark ADLS Gen2 Benutzerdefinierte verwaltete Identität (MSI) des Clusters Die vom Benutzer zugewiesene MSI muss die Rolle "Storage Blob Data Owner" für das Speicherkonto haben.

Anmerkung

Um ein Speicherkonto über mehrere Cluster hinweg freizugeben, können Sie dem freigegebenen Speicherkonto einfach die entsprechende, dem Benutzer des Clusters zugewiesene verwaltete Identität (MSI) "Storage Blob Data Owner" zuweisen. Erfahren Sie, wie Sie eine Rolle zuweisen.

Danach können Sie den vollständigen Speicher abfs:// Pfad verwenden, um über Ihre Anwendungen auf die Daten zuzugreifen.

Weitere Informationen finden Sie unter Verwaltete Identitäten für Azure-Ressourcen.
Erfahren Sie, wie Sie ein ADLS Gen2-Kontoerstellen.

Azure HDInsight auf der AKS-Speicherarchitektur

Das folgende Diagramm bietet eine abstrakte Ansicht der Azure HDInsight-Architektur auf AKS innerhalb von Azure Storage.

Screenshot der Speicherarchitektur.

Speicherverwaltung

Derzeit unterstützt Azure HDInsight auf AKS keine Speicherkonten mit aktiviertem vorläufigem Löschen, stellen Sie sicher, dass Sie das vorläufige Löschen für Ihr Speicherkonto deaktivieren.

Screenshot mit Portal-UI zum sanften Löschen.