Wat is er nieuw in HDInsight op AKS? (Preview)

Artikel
09/20/2024

Belangrijk

Azure HDInsight op AKS is op 31 januari 2025 buiten gebruik gesteld. Meer informatie over in deze aankondiging.

U moet uw workloads migreren naar Microsoft Fabric- of een gelijkwaardig Azure-product om plotselinge beëindiging van uw workloads te voorkomen.

Belangrijk

Deze functie is momenteel beschikbaar als preview-versie. De aanvullende gebruiksvoorwaarden voor Microsoft Azure Previews meer juridische voorwaarden bevatten die van toepassing zijn op Azure-functies die bèta, in preview of anderszins nog niet in algemene beschikbaarheid zijn vrijgegeven. Voor meer informatie over deze specifieke preview, zie Azure HDInsight op AKS preview-informatie. Voor vragen of suggesties voor functies dient u een aanvraag in op AskHDInsight- met de details en volgt u ons voor meer updates over Azure HDInsight Community-.

In HDInsight op AKS hebben alle clusterbeheer en -bewerkingen systeemeigen ondersteuning voor servicebeheer in Azure Portal voor afzonderlijke clusters.

In HDInsight op AKS worden twee nieuwe concepten geïntroduceerd:

clustergroepen worden gebruikt om clusters te groeperen en te beheren.
clusters worden gebruikt voor opensource-berekeningen, worden ze gehost in een clustergroep.

Clustergroepen

HDInsight in AKS wordt uitgevoerd op Azure Kubernetes Service (AKS). De resource op het hoogste niveau is de clustergroep en beheert alle clusters die op hetzelfde AKS-cluster worden uitgevoerd. Wanneer u een clustergroep maakt, wordt er tegelijkertijd een onderliggend AKS-cluster gemaakt om alle clusters in de pool te hosten. Clustergroepen zijn een logische groepering van clusters, die helpen bij het bouwen van robuuste interoperabiliteit tussen meerdere clustertypen en waarmee ondernemingen de clusters in hetzelfde virtuele netwerk kunnen hebben. Clustergroepen bieden snelle en rendabele toegang tot alle clustertypen die op aanvraag en op schaal zijn gemaakt. Eén clustergroep komt overeen met één cluster in de AKS-infrastructuur.

Clusters

Clusters zijn afzonderlijke opensource-rekenworkloads, zoals Apache Spark, Apache Flink en Trino, die in enkele minuten snel kunnen worden gemaakt met vooraf ingestelde configuraties en weinig klikken. Hoewel elk cluster wordt uitgevoerd in dezelfde clustergroep, kan elk cluster zijn eigen configuraties hebben, zoals clustertype, versie, vm-grootte van knooppunten, aantal knooppunten. Clusters worden uitgevoerd op gescheiden rekenresources met eigen DNS en eindpunten.

Functies die momenteel in preview zijn

De volgende tabel bevat de functies van HDInsight in AKS die momenteel in preview zijn. Preview-functies worden alfabetisch gesorteerd.

Gebied	Functies
Grondbeginselen	Pool en clusters maken met behulp van portal, SSH-ondersteuning (Web Secure Shell), mogelijkheid om het aantal werkknooppunten te kiezen tijdens het maken van het cluster
Opslag	ADLS Gen2 Storage--ondersteuning voor
Metastore	Externe metastore-ondersteuning voor Trino, Spark en Flink, integreren met HDInsight-
Veiligheid	Ondersteuning voor ARM RBAC, Ondersteuning voor Verificatie op Basis van MSI, Mogelijkheid om clustertoegang aan andere gebruikers te geven
Logboekregistratie en bewaking	Logboekaggregatie in Azure Log Analytics-, voor serverlogboeken, clustermetingen en servicemetingen via beheerde Prometheus- en Grafana-, serverondersteuning in Azure Monitor-, pagina over de status van de service voor het bewaken van de status van de service
Automatisch schalen	Op belasting gebaseerde automatische schaalvergrotingen op planning gebaseerde automatische schaalvergroting
Clusters aanpassen en configureren	Ondersteuning voor scriptacties tijdens het maken van het cluster, ondersteuning voor bibliotheekbeheer, serviceconfiguratie instellingen na het maken van het cluster
Trino	Ondersteuning voor Trino-catalogi, Trino CLI-ondersteuning, DBeaver ondersteuning voor het indienen van query's, het toevoegen of verwijderen van plugins en connectors, ondersteuning voor gebeurtenissen bij het loggen van query's, ondersteuning voor scanquerystatistieken voor elke connector in het Trino-dashboard, ondersteuning voor het Trino--dashboard om query's te monitoren, query-caching, integratie met Power BI, integratie met Apache Superset, Redash, en ondersteuning voor meerdere connectors.
Flink	Ondersteuning voor de Flink native webinterface, Flink-ondersteuning met HMS voor DStream, opdrachten verzenden naar het cluster met behulp van REST API en Azure Portal, programma's uitvoeren die zijn verpakt als JAR-bestanden via de Flink CLI, ondersteuning voor persistente Savepoints, ondersteuning voor het bijwerken van de configuratieopties tijdens het uitvoeren van de taak, verbinding maken met meerdere Azure-services: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, opdrachten verzenden naar het cluster met behulp van Flink CLI en CDC met Flink
Vonk	Jupyter Notebook, Ondersteuning voor Delta Lake 2.0, Ondersteuning voor Zeppelin, Ondersteuning voor ATS, Ondersteuning voor Yarn History Server Interface, Taakindiening via SSH, Taakindiening via SDK en Machine Learning Notebook

Roadmap van functies

Kenmerk	Geschatte releasetijdlijn	Status
Automatisch schalen - Op basis van belasting - Trino-	1e kwartaal 2024	Volbracht
Automatisch schalen voor Spark gebaseerd op shuffle-bewuste belasting	2e kwartaal 2024	Wordt uitgevoerd
In Place Upgrade ter plaatse	2e kwartaal 2024	Volbracht
Ondersteuning voor Reserved Instances	2e kwartaal 2024	Wordt uitgevoerd
MSI-verificatie voor Metastore (SQL)	1e kwartaal 2024	Wordt uitgevoerd
Spark 3.4	Q2 2024	In uitvoering
Trino 426	Q1 2024	Volbracht
Ranger voor RBAC	2e kwartaal 2024	Wordt uitgevoerd
ondersteuning voor de app-modus voor Flink	1e kwartaal 2024	Volbracht
Flink 1.17	1e kwartaal 2024	Volbracht
Spark ACID-ondersteuning	1e kwartaal 2024	In uitvoering
Configureerbare SKU's voor Headnode, SSH	tweede kwartaal 2024	Wordt uitgevoerd
Flink SQL Gateway-ondersteuning	1e kwartaal 2024	Volbracht
privéclusters voor HDInsight op AKS	Q1 2024	Volbracht
Ranger-ondersteuning voor Spark SQL	4e kwartaal 2024	In uitvoering
Ranger-ACLs in de opslaglaag	vierde kwartaal 2024	Wordt uitgevoerd
Ondersteuning voor One Lake als primaire container	K2 2024	Wordt uitgevoerd

Delen via

Wat is er nieuw in HDInsight op AKS? (Preview)

Clustergroepen

Clusters

Functies die momenteel in preview zijn

Roadmap van functies

Aanvullende resources