Vad är nytt i HDInsight på AKS? (Förhandsversion)

Artikel
09/20/2024

Viktig

Azure HDInsight på AKS drogs tillbaka den 31 januari 2025. Läs mer i det här meddelandet.

Du måste migrera dina arbetsbelastningar till Microsoft Fabric- eller en motsvarande Azure-produkt för att undvika plötsliga uppsägningar av dina arbetsbelastningar.

Viktig

Den här funktionen är för närvarande i förhandsversion. De kompletterande användningsvillkoren för förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i beta, förhandsversion eller annars ännu inte släppta för allmän användning. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. För frågor eller funktionsförslag, vänligen skicka in en begäran på AskHDInsight med detaljerna och följ oss för fler uppdateringar om Azure HDInsight Community.

I HDInsight på AKS har alla klusterhantering och åtgärder internt stöd för tjänsthantering på Azure-portalen för enskilda kluster.

I HDInsight på AKS introduceras två nya begrepp:

Cluster Pools används för att gruppera och hantera kluster.
Kluster används för beräkningar med öppen källkod, och de är värd inom en pool av kluster.

Klusterpooler

HDInsight på AKS körs på Azure Kubernetes Service (AKS). Resursen på den översta nivån är klusterpoolen och hanterar alla kluster som körs i samma AKS-kluster. När du skapar en klusterpool skapas ett underliggande AKS-kluster samtidigt för att vara värd för alla kluster i poolen. Klusterpooler är en logisk gruppering av kluster som hjälper till att skapa robust samverkan mellan flera klustertyper och gör det möjligt för företag att ha klustren i samma virtuella nätverk. Klusterpooler ger snabb och kostnadseffektiv åtkomst till alla klustertyper som skapas på begäran och i stor skala. En klusterpool motsvarar ett kluster i AKS-infrastrukturen.

Kluster

Kluster är enskilda beräkningsarbetsbelastningar med öppen källkod, till exempel Apache Spark, Apache Flink och Trino, som kan skapas snabbt på några minuter med förinställda konfigurationer och få klick. Även om de körs i samma klusterpool kan varje kluster ha sina egna konfigurationer, till exempel klustertyp, version, vm-storlek för nod, antal noder. Kluster körs på avgränsade beräkningsresurser med egna DNS- och slutpunkter.

Funktioner som för närvarande är i förhandsversion

Följande tabelllista visar funktionerna i HDInsight på AKS som för närvarande är i förhandsversion. Förhandsversionsfunktionerna sorteras alfabetiskt.

Område	Funktioner
Grunderna	Skapa pooler och kluster med hjälp av portalen, stöd för Web Secure Shell (ssh), Möjlighet att välja antal arbetsnoder när klustret skapas
Lagring	ADLS Gen2 Storage stöder
Metastore	Stöd för externt metaarkiv för Trino, Spark och Flink, Integrera med HDInsight
Säkerhet	Stöd för ARM RBAC, stöd för MSI-baserad autentisering, Alternativ för att ge klusteråtkomst till andra användare
Loggning och övervakning	Loggaggregering i Azure log analyticsför serverloggar, kluster- och tjänstmått via Hanterad Prometheus och Grafana, Stöd för servermått i Azure Monitor, tjänststatussida för övervakning av Service Health
Automatisk skalning	Belastningsbaserad automatisk skalningoch schemabaserad automatisk skalning
Anpassa och konfigurera kluster	Stöd för skriptåtgärder när klustret skapas, Stöd för bibliotekshantering, Tjänstkonfiguration inställningar när klustret har skapats
Trino	Stöd för Trino-kataloger, Stöd för Trino CLI, DBeaver stöd för frågeöverföring, Lägg till eller ta bort plugin-program och anslutningsappar, Stöd för loggningsfråga händelser, Stöd för genomsökning av frågestatistik för alla Connector- på Trino-instrumentpanelen, Stöd för Trino instrumentpanel för att övervaka frågor. Query Caching, Integration with Power BI, Integration with Apache Superset, Redash, Support for multiple connectors
Flink	Stöd för Flink-inbyggt webbgränssnitt, Flink-stöd med HMS för DStream, Skicka jobb till klustret med hjälp av REST API och Azure-portalen, Kör program paketerade som JAR-filer via Flink CLI-, Stöd för beständiga savepoints, Stöd för att uppdatera konfigurationsalternativen när jobbet körs, Ansluta till flera Azure-tjänster: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Submit jobs to the cluster using Flink CLI and CDC with Flink
Gnista	Jupyter Notebook, Stöd för Delta lake 2.0, Zeppelin-stöd, Stöd för ATS, Stöd för Yarn Historikservergränssnitt, Jobbinsändning med SSH, Jobbinsändning med SDK och Maskininlärningsanteckningsbok

Översikt över funktioner

Funktion	Uppskattad tidslinje för lansering	Status
Autoskalning – belastningsbaserad – Trino-	Q1 2024	Fullbordad
Automatiskt skalbar belastning med medvetenhet om omrörning för Spark	Kvartal 2 2024	Pågår
Uppgradering på plats	andra kvartalet 2024	Fullbordad
Stöd för reserverade instanser	2:a kvartalet 2024	Pågår
MSI-baserad autentisering för Metastore (SQL)	K1 2024	Pågår
Spark 3.4	2:a kvartalet 2024	Pågår
Trino 426	Q1 2024	Fullbordad
Ranger för RBAC	2:a kvartalet 2024	Pågår
stöd för applikationsläge för Flink	Första kvartalet 2024 (Q1 2024)	Fullbordad
Flink 1.17	1:a kvartalet 2024	Fullbordad
Stöd för Spark ACID	Kvartal 1 2024	Pågår
Konfigurerbara SKU:er för Headnode, SSH	Q2 2024	Pågår
Flink SQL Gateway-stöd	1:a kvartalet 2024	Fullbordad
Privata kluster för HDInsight på AKS	Första kvartalet 2024	Fullbordad
Ranger-stöd för Spark SQL	Fjärde kvartalet 2024	Pågår
Ranger-ACL:er på lagringsnivå	Fjärde kvartalet 2024	Pågår
Stöd för One Lake som primär container	Kvartal 2 2024	Pågår

Dela via

Vad är nytt i HDInsight på AKS? (Förhandsversion)

Klusterpooler

Kluster

Funktioner som för närvarande är i förhandsversion

Översikt över funktioner

Ytterligare resurser