Vad är nytt i HDInsight på AKS? (Förhandsversion)
Viktig
Azure HDInsight på AKS drogs tillbaka den 31 januari 2025. Läs mer i det här meddelandet.
Du måste migrera dina arbetsbelastningar till Microsoft Fabric- eller en motsvarande Azure-produkt för att undvika plötsliga uppsägningar av dina arbetsbelastningar.
Viktig
Den här funktionen är för närvarande i förhandsversion. De kompletterande användningsvillkoren för förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i beta, förhandsversion eller annars ännu inte släppta för allmän användning. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. För frågor eller funktionsförslag, vänligen skicka in en begäran på AskHDInsight med detaljerna och följ oss för fler uppdateringar om Azure HDInsight Community.
I HDInsight på AKS har alla klusterhantering och åtgärder internt stöd för tjänsthantering på Azure-portalen för enskilda kluster.
I HDInsight på AKS introduceras två nya begrepp:
- Cluster Pools används för att gruppera och hantera kluster.
- Kluster används för beräkningar med öppen källkod, och de är värd inom en pool av kluster.
Klusterpooler
HDInsight på AKS körs på Azure Kubernetes Service (AKS). Resursen på den översta nivån är klusterpoolen och hanterar alla kluster som körs i samma AKS-kluster. När du skapar en klusterpool skapas ett underliggande AKS-kluster samtidigt för att vara värd för alla kluster i poolen. Klusterpooler är en logisk gruppering av kluster som hjälper till att skapa robust samverkan mellan flera klustertyper och gör det möjligt för företag att ha klustren i samma virtuella nätverk. Klusterpooler ger snabb och kostnadseffektiv åtkomst till alla klustertyper som skapas på begäran och i stor skala. En klusterpool motsvarar ett kluster i AKS-infrastrukturen.
Kluster
Kluster är enskilda beräkningsarbetsbelastningar med öppen källkod, till exempel Apache Spark, Apache Flink och Trino, som kan skapas snabbt på några minuter med förinställda konfigurationer och få klick. Även om de körs i samma klusterpool kan varje kluster ha sina egna konfigurationer, till exempel klustertyp, version, vm-storlek för nod, antal noder. Kluster körs på avgränsade beräkningsresurser med egna DNS- och slutpunkter.
Funktioner som för närvarande är i förhandsversion
Följande tabelllista visar funktionerna i HDInsight på AKS som för närvarande är i förhandsversion. Förhandsversionsfunktionerna sorteras alfabetiskt.
Område | Funktioner |
---|---|
Grunderna | Skapa pooler och kluster med hjälp av portalen, stöd för Web Secure Shell (ssh), Möjlighet att välja antal arbetsnoder när klustret skapas |
Lagring | ADLS Gen2 Storage stöder |
Metastore | Stöd för externt metaarkiv för Trino, Spark och Flink, Integrera med HDInsight |
Säkerhet | Stöd för ARM RBAC, stöd för MSI-baserad autentisering, Alternativ för att ge klusteråtkomst till andra användare |
Loggning och övervakning | Loggaggregering i Azure log analyticsför serverloggar, kluster- och tjänstmått via Hanterad Prometheus och Grafana, Stöd för servermått i Azure Monitor, tjänststatussida för övervakning av Service Health |
Automatisk skalning | Belastningsbaserad automatisk skalningoch schemabaserad automatisk skalning |
Anpassa och konfigurera kluster | Stöd för skriptåtgärder när klustret skapas, Stöd för bibliotekshantering, Tjänstkonfiguration inställningar när klustret har skapats |
Trino | Stöd för Trino-kataloger, Stöd för Trino CLI, DBeaver stöd för frågeöverföring, Lägg till eller ta bort plugin-program och anslutningsappar, Stöd för loggningsfråga händelser, Stöd för genomsökning av frågestatistik för alla Connector- på Trino-instrumentpanelen, Stöd för Trino instrumentpanel för att övervaka frågor. Query Caching, Integration with Power BI, Integration with Apache Superset, Redash, Support for multiple connectors |
Flink | Stöd för Flink-inbyggt webbgränssnitt, Flink-stöd med HMS för DStream, Skicka jobb till klustret med hjälp av REST API och Azure-portalen, Kör program paketerade som JAR-filer via Flink CLI-, Stöd för beständiga savepoints, Stöd för att uppdatera konfigurationsalternativen när jobbet körs, Ansluta till flera Azure-tjänster: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Submit jobs to the cluster using Flink CLI and CDC with Flink |
Gnista | Jupyter Notebook, Stöd för Delta lake 2.0, Zeppelin-stöd, Stöd för ATS, Stöd för Yarn Historikservergränssnitt, Jobbinsändning med SSH, Jobbinsändning med SDK och Maskininlärningsanteckningsbok |
Översikt över funktioner
Funktion | Uppskattad tidslinje för lansering | Status |
---|---|---|
Autoskalning – belastningsbaserad – Trino- | Q1 2024 | Fullbordad |
Automatiskt skalbar belastning med medvetenhet om omrörning för Spark | Kvartal 2 2024 | Pågår |
Uppgradering på plats | andra kvartalet 2024 | Fullbordad |
Stöd för reserverade instanser | 2:a kvartalet 2024 | Pågår |
MSI-baserad autentisering för Metastore (SQL) | K1 2024 | Pågår |
Spark 3.4 | 2:a kvartalet 2024 | Pågår |
Trino 426 | Q1 2024 | Fullbordad |
Ranger för RBAC | 2:a kvartalet 2024 | Pågår |
stöd för applikationsläge för Flink | Första kvartalet 2024 (Q1 2024) | Fullbordad |
Flink 1.17 | 1:a kvartalet 2024 | Fullbordad |
Stöd för Spark ACID | Kvartal 1 2024 | Pågår |
Konfigurerbara SKU:er för Headnode, SSH | Q2 2024 | Pågår |
Flink SQL Gateway-stöd | 1:a kvartalet 2024 | Fullbordad |
Privata kluster för HDInsight på AKS | Första kvartalet 2024 | Fullbordad |
Ranger-stöd för Spark SQL | Fjärde kvartalet 2024 | Pågår |
Ranger-ACL:er på lagringsnivå | Fjärde kvartalet 2024 | Pågår |
Stöd för One Lake som primär container | Kvartal 2 2024 | Pågår |