Wat is er nieuw in HDInsight op AKS? (Preview)
Belangrijk
Azure HDInsight op AKS is op 31 januari 2025 buiten gebruik gesteld. Meer informatie over in deze aankondiging.
U moet uw workloads migreren naar Microsoft Fabric- of een gelijkwaardig Azure-product om plotselinge beëindiging van uw workloads te voorkomen.
Belangrijk
Deze functie is momenteel beschikbaar als preview-versie. De aanvullende gebruiksvoorwaarden voor Microsoft Azure Previews meer juridische voorwaarden bevatten die van toepassing zijn op Azure-functies die bèta, in preview of anderszins nog niet in algemene beschikbaarheid zijn vrijgegeven. Voor meer informatie over deze specifieke preview, zie Azure HDInsight op AKS preview-informatie. Voor vragen of suggesties voor functies dient u een aanvraag in op AskHDInsight- met de details en volgt u ons voor meer updates over Azure HDInsight Community-.
In HDInsight op AKS hebben alle clusterbeheer en -bewerkingen systeemeigen ondersteuning voor servicebeheer in Azure Portal voor afzonderlijke clusters.
In HDInsight op AKS worden twee nieuwe concepten geïntroduceerd:
- clustergroepen worden gebruikt om clusters te groeperen en te beheren.
- clusters worden gebruikt voor opensource-berekeningen, worden ze gehost in een clustergroep.
Clustergroepen
HDInsight in AKS wordt uitgevoerd op Azure Kubernetes Service (AKS). De resource op het hoogste niveau is de clustergroep en beheert alle clusters die op hetzelfde AKS-cluster worden uitgevoerd. Wanneer u een clustergroep maakt, wordt er tegelijkertijd een onderliggend AKS-cluster gemaakt om alle clusters in de pool te hosten. Clustergroepen zijn een logische groepering van clusters, die helpen bij het bouwen van robuuste interoperabiliteit tussen meerdere clustertypen en waarmee ondernemingen de clusters in hetzelfde virtuele netwerk kunnen hebben. Clustergroepen bieden snelle en rendabele toegang tot alle clustertypen die op aanvraag en op schaal zijn gemaakt. Eén clustergroep komt overeen met één cluster in de AKS-infrastructuur.
Clusters
Clusters zijn afzonderlijke opensource-rekenworkloads, zoals Apache Spark, Apache Flink en Trino, die in enkele minuten snel kunnen worden gemaakt met vooraf ingestelde configuraties en weinig klikken. Hoewel elk cluster wordt uitgevoerd in dezelfde clustergroep, kan elk cluster zijn eigen configuraties hebben, zoals clustertype, versie, vm-grootte van knooppunten, aantal knooppunten. Clusters worden uitgevoerd op gescheiden rekenresources met eigen DNS en eindpunten.
Functies die momenteel in preview zijn
De volgende tabel bevat de functies van HDInsight in AKS die momenteel in preview zijn. Preview-functies worden alfabetisch gesorteerd.
Gebied | Functies |
---|---|
Grondbeginselen | Pool en clusters maken met behulp van portal, SSH-ondersteuning (Web Secure Shell), mogelijkheid om het aantal werkknooppunten te kiezen tijdens het maken van het cluster |
Opslag | ADLS Gen2 Storage--ondersteuning voor |
Metastore | Externe metastore-ondersteuning voor Trino, Spark en Flink, integreren met HDInsight- |
Veiligheid | Ondersteuning voor ARM RBAC, Ondersteuning voor Verificatie op Basis van MSI, Mogelijkheid om clustertoegang aan andere gebruikers te geven |
Logboekregistratie en bewaking | Logboekaggregatie in Azure Log Analytics-, voor serverlogboeken, clustermetingen en servicemetingen via beheerde Prometheus- en Grafana-, serverondersteuning in Azure Monitor-, pagina over de status van de service voor het bewaken van de status van de service |
Automatisch schalen | Op belasting gebaseerde automatische schaalvergrotingen op planning gebaseerde automatische schaalvergroting |
Clusters aanpassen en configureren | Ondersteuning voor scriptacties tijdens het maken van het cluster, ondersteuning voor bibliotheekbeheer, serviceconfiguratie instellingen na het maken van het cluster |
Trino | Ondersteuning voor Trino-catalogi, Trino CLI-ondersteuning, DBeaver ondersteuning voor het indienen van query's, het toevoegen of verwijderen van plugins en connectors, ondersteuning voor gebeurtenissen bij het loggen van query's, ondersteuning voor scanquerystatistieken voor elke connector in het Trino-dashboard, ondersteuning voor het Trino--dashboard om query's te monitoren, query-caching, integratie met Power BI, integratie met Apache Superset, Redash, en ondersteuning voor meerdere connectors. |
Flink | Ondersteuning voor de Flink native webinterface, Flink-ondersteuning met HMS voor DStream, opdrachten verzenden naar het cluster met behulp van REST API en Azure Portal, programma's uitvoeren die zijn verpakt als JAR-bestanden via de Flink CLI, ondersteuning voor persistente Savepoints, ondersteuning voor het bijwerken van de configuratieopties tijdens het uitvoeren van de taak, verbinding maken met meerdere Azure-services: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, opdrachten verzenden naar het cluster met behulp van Flink CLI en CDC met Flink |
Vonk | Jupyter Notebook, Ondersteuning voor Delta Lake 2.0, Ondersteuning voor Zeppelin, Ondersteuning voor ATS, Ondersteuning voor Yarn History Server Interface, Taakindiening via SSH, Taakindiening via SDK en Machine Learning Notebook |
Roadmap van functies
Kenmerk | Geschatte releasetijdlijn | Status |
---|---|---|
Automatisch schalen - Op basis van belasting - Trino- | 1e kwartaal 2024 | Volbracht |
Automatisch schalen voor Spark gebaseerd op shuffle-bewuste belasting | 2e kwartaal 2024 | Wordt uitgevoerd |
In Place Upgrade ter plaatse | 2e kwartaal 2024 | Volbracht |
Ondersteuning voor Reserved Instances | 2e kwartaal 2024 | Wordt uitgevoerd |
MSI-verificatie voor Metastore (SQL) | 1e kwartaal 2024 | Wordt uitgevoerd |
Spark 3.4 | Q2 2024 | In uitvoering |
Trino 426 | Q1 2024 | Volbracht |
Ranger voor RBAC | 2e kwartaal 2024 | Wordt uitgevoerd |
ondersteuning voor de app-modus voor Flink | 1e kwartaal 2024 | Volbracht |
Flink 1.17 | 1e kwartaal 2024 | Volbracht |
Spark ACID-ondersteuning | 1e kwartaal 2024 | In uitvoering |
Configureerbare SKU's voor Headnode, SSH | tweede kwartaal 2024 | Wordt uitgevoerd |
Flink SQL Gateway-ondersteuning | 1e kwartaal 2024 | Volbracht |
privéclusters voor HDInsight op AKS | Q1 2024 | Volbracht |
Ranger-ondersteuning voor Spark SQL | 4e kwartaal 2024 | In uitvoering |
Ranger-ACLs in de opslaglaag | vierde kwartaal 2024 | Wordt uitgevoerd |
Ondersteuning voor One Lake als primaire container | K2 2024 | Wordt uitgevoerd |