Vad är nytt i HDInsight på AKS? (Förhandsversion)
Kommentar
Vi drar tillbaka Azure HDInsight på AKS den 31 januari 2025. Före den 31 januari 2025 måste du migrera dina arbetsbelastningar till Microsoft Fabric eller en motsvarande Azure-produkt för att undvika plötsliga uppsägningar av dina arbetsbelastningar. Återstående kluster i din prenumeration stoppas och tas bort från värden.
Endast grundläggande stöd kommer att vara tillgängligt fram till datumet för pensionering.
Viktigt!
Den här funktionen finns i förhandsgranskning. De kompletterande användningsvillkoren för Förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i betaversion, förhandsversion eller på annat sätt ännu inte har släppts i allmän tillgänglighet. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. Om du vill ha frågor eller funktionsförslag skickar du en begäran på AskHDInsight med informationen och följer oss för fler uppdateringar i Azure HDInsight Community.
I HDInsight på AKS har alla klusterhantering och -åtgärder internt stöd för tjänsthantering på Azure Portal för enskilda kluster.
I HDInsight på AKS introduceras två nya begrepp:
- Klusterpooler används för att gruppera och hantera kluster.
- Kluster används för öppen källkod beräkningar, de finns i en klusterpool.
Klusterpooler
HDInsight på AKS körs på Azure Kubernetes Service (AKS). Resursen på den översta nivån är klusterpoolen och hanterar alla kluster som körs i samma AKS-kluster. När du skapar en klusterpool skapas ett underliggande AKS-kluster samtidigt för att vara värd för alla kluster i poolen. Klusterpooler är en logisk gruppering av kluster som hjälper till att skapa robust samverkan mellan flera klustertyper och gör det möjligt för företag att ha klustren i samma virtuella nätverk. Klusterpooler ger snabb och kostnadseffektiv åtkomst till alla klustertyper som skapas på begäran och i stor skala. En klusterpool motsvarar ett kluster i AKS-infrastrukturen.
Kluster
Kluster är enskilda öppen källkod beräkningsarbetsbelastningar, till exempel Apache Spark, Apache Flink och Trino, som kan skapas snabbt på några minuter med förinställda konfigurationer och få klick. Även om de körs i samma klusterpool kan varje kluster ha sina egna konfigurationer, till exempel klustertyp, version, vm-storlek för nod, antal noder. Kluster körs på avgränsade beräkningsresurser med egna DNS- och slutpunkter.
Funktioner som för närvarande är i förhandsversion
Följande tabelllista visar funktionerna i HDInsight på AKS som för närvarande är i förhandsversion. Förhandsversionsfunktionerna sorteras alfabetiskt.
Ytdiagram | Funktioner |
---|---|
Grunder | Skapa pooler och kluster med hjälp av portalen, stöd för Web Secure Shell (ssh), Möjlighet att välja antal arbetsnoder när klustret skapas |
Storage | Stöd för ADLS Gen2 Storage |
Metaarkiv | Stöd för externt metaarkiv för Trino, Spark och Flink, Integrera med HDInsight |
Säkerhet | Stöd för ARM RBAC, stöd för MSI-baserad autentisering, Alternativ för att ge klusteråtkomst till andra användare |
Loggning och övervakning | Loggaggregering i Azure Log Analytics, för serverloggar, kluster- och tjänstmått via Hanterad Prometheus och Grafana, Stöd för servermått i Azure Monitor, sidan Tjänststatus för övervakning av Tjänststatus |
Autoskala | Belastningsbaserad automatisk skalning och schemabaserad automatisk skalning |
Anpassa och konfigurera kluster | Stöd för skriptåtgärder när kluster skapas, Stöd för bibliotekshantering, Tjänstkonfigurationsinställningar när klustret har skapats |
Trino | Stöd för Trino-kataloger, Trino CLI-stöd, DBeaver-stöd för frågeöverföring, Lägga till eller ta bort plugin-program och anslutningsappar, Stöd för loggning av frågehändelser, Stöd för genomsökningsfrågasstatistik för alla anslutningsappar i Trino-instrumentpanelen, Stöd för Trino-instrumentpanel för att övervaka frågor, Frågecachelagring, Integrering med Power BI, Integrering med Apache Superset , Redash, Stöd för flera anslutningsappar |
Flink | Stöd för Flink-inbyggt webbgränssnitt, Flink-stöd med HMS för DStream, Skicka jobb till klustret med hjälp av REST API och Azure Portal, Kör program paketerade som JAR-filer via Flink CLI, Stöd för beständiga savepoints, Stöd för uppdatering av konfigurationsalternativ när jobbet körs, Ansluta till flera Azure-tjänster: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Skicka jobb till klustret med Flink CLI och CDC med Flink |
Spark | Jupyter Notebook, Stöd för Delta lake 2.0, Zeppelin Support, Support ATS, Support for Yarn History Server Interface, Job submission using SSH, Job submission using SDK and Machine Learning Notebook |
Översikt över funktioner
Funktion | Uppskattad tidslinje för lansering | Status |
---|---|---|
Autoskalning – belastningsbaserad – Trino | Q1 2024 | Slutförd |
Blanda medveten belastningsbaserad automatisk skalning för Spark | Q2 2024 | Pågående |
Uppgradering på plats | Q2 2024 | Slutförd |
Stöd för reserverad instans | Q2 2024 | Pågående |
MSI-baserad autentisering för Metastore (SQL) | Q1 2024 | Pågående |
Spark 3.4 | Q2 2024 | Pågående |
Trino 426 | Q1 2024 | Slutförd |
Ranger för RBAC | Q2 2024 | Pågående |
Stöd för appläge för Flink | Q1 2024 | Slutförd |
Flink 1.17 | Q1 2024 | Slutförd |
Stöd för Spark ACID | Q1 2024 | Pågående |
Konfigurerbara SKU:er för Headnode, SSH | Q2 2024 | Pågående |
Stöd för Flink SQL Gateway | Q1 2024 | Slutförd |
Privata kluster för HDInsight på AKS | Q1 2024 | Slutförd |
Ranger-stöd för Spark SQL | Q4 2024 | Pågående |
Ranger-ACL:er på lagringslager | Q4 2024 | Pågående |
Stöd för One Lake som primär container | Q2 2024 | Pågår |