Delen via


Inleiding tot clusteropslag

Belangrijk

Azure HDInsight op AKS is op 31 januari 2025 buiten gebruik gesteld. Lees meer over middels deze aankondiging.

U moet uw workloads migreren naar Microsoft Fabric- of een gelijkwaardig Azure-product om plotselinge beëindiging van uw workloads te voorkomen.

Belangrijk

Deze functie is momenteel beschikbaar als preview-versie. De aanvullende gebruiksvoorwaarden voor Microsoft Azure Previews meer juridische voorwaarden bevatten die van toepassing zijn op Azure-functies die bèta, in preview of anderszins nog niet in algemene beschikbaarheid zijn vrijgegeven. Zie Azure HDInsight in AKS preview-informatievoor meer informatie over deze specifieke preview. Voor vragen of suggesties voor functies dient u een aanvraag in op AskHDInsight- met de details en volgt u ons voor meer updates over Azure HDInsight Community-.

Azure HDInsight in AKS kan naadloos worden geïntegreerd met Azure Storage. Dit is een opslagoplossing voor algemeen gebruik die goed werkt met veel andere Azure-services. Azure Data Lake Storage Gen2 (ADLS Gen 2) is het standaardbestandssysteem voor de clusters.

Het opslagaccount kan worden gebruikt als de standaardlocatie voor gegevens, clusterlogboeken en andere uitvoer die tijdens de clusterbewerking wordt gegenereerd. Het kan ook een standaardopslag zijn voor de Hive-catalogus die afhankelijk is van het clustertype.

Zie Inleiding tot Azure Data Lake Storage Gen2voor meer informatie.

Beheerde identiteiten voor beveiligde bestandstoegang

Azure HDInsight in AKS maakt gebruik van beheerde identiteiten (MSI) om clustertoegang tot bestanden in Azure Data Lake Storage Gen2 te beveiligen. Beheerde identiteit is een functie van Microsoft Entra-id die Azure-services biedt met een set automatisch beheerde referenties. Deze referenties kunnen worden gebruikt voor verificatie bij elke service die Ondersteuning biedt voor Active Directory-verificatie. Bovendien hoeft u voor beheerde identiteiten geen referenties op te slaan in code- of configuratiebestanden.

Wanneer u in Azure HDInsight in AKS een beheerde identiteit en opslag selecteert tijdens het maken van het cluster, kan de beheerde identiteit naadloos werken met opslag voor gegevensbeheer, mits de eigenaar van opslagblobgegevens rol wordt toegewezen aan de door de gebruiker toegewezen MSI.

De volgende tabel bevat een overzicht van de ondersteunde opslagopties voor Azure HDInsight in AKS (openbare preview):

Cluster type Ondersteunde opslag Verbinding Functie bij opslag
Trino, Apache Flink en Apache Spark ADLS Gen2 Door de gebruiker toegewezen beheerde identiteit van het cluster (MSI) De door de gebruiker toegewezen MSI moet de rol Storage Blob Data-eigenaar hebben op het opslagaccount.

Notitie

Als u een opslagaccount wilt delen tussen meerdere clusters, kunt u gewoon het bijbehorende door de gebruiker toegewezen MSI 'Storage Blob Data Owner' op het gedeelde opslagaccount toewijzen. Meer informatie over het toewijzen van een rol.

Daarna kunt u het volledige opslagpad abfs:// gebruiken om toegang te krijgen tot de gegevens via uw toepassingen.

Zie Beheerde identiteiten voor Azure-resourcesvoor meer informatie.
Meer informatie over het maken van een ADLS Gen2-account.

Azure HDInsight in AKS-opslagarchitectuur

Het volgende diagram biedt een abstracte weergave van de Azure HDInsight in AKS-architectuur van Azure Storage.

schermopname van de opslagarchitectuur.

Opslagbeheer

Op dit moment biedt Azure HDInsight in AKS geen ondersteuning voor opslagaccounts waarvoor voorlopig verwijderen is ingeschakeld. Zorg ervoor dat u voorlopig verwijderen uitschakelt voor uw opslagaccount.

Schermopname van de portalgebruikersinterface voor zachte verwijdering.