Sdílet prostřednictvím


Co je nového ve službě HDInsight v AKS? (Preview)

Poznámka:

Azure HDInsight vyřadíme ze služby AKS 31. ledna 2025. Před 31. lednem 2025 budete muset migrovat úlohy do Microsoft Fabric nebo ekvivalentního produktu Azure, abyste se vyhnuli náhlému ukončení úloh. Zbývající clustery ve vašem předplatném se zastaví a odeberou z hostitele.

Do data vyřazení bude k dispozici pouze základní podpora.

Důležité

Tato funkce je aktuálně dostupná jako ukázková verze. Doplňkové podmínky použití pro Microsoft Azure Preview obsahují další právní podmínky, které se vztahují na funkce Azure, které jsou v beta verzi, ve verzi Preview nebo ještě nejsou vydány v obecné dostupnosti. Informace o této konkrétní verzi Preview najdete v tématu Azure HDInsight o službě AKS ve verzi Preview. Pokud máte dotazy nebo návrhy funkcí, odešlete prosím žádost na AskHDInsight s podrobnostmi a sledujte nás o dalších aktualizacích v komunitě Azure HDInsight.

Ve službě HDInsight v AKS mají všechny operace a správu clusteru nativní podporu pro správu služeb na webu Azure Portal pro jednotlivé clustery.

Ve službě HDInsight v AKS jsou zavedeny dva nové koncepty:

  • Fondy clusterů se používají k seskupení a správě clusterů.
  • Clustery se používají pro opensourcové výpočetní prostředky, které jsou hostované v rámci fondu clusterů.

Fondy clusterů

HDInsight v AKS běží ve službě Azure Kubernetes Service (AKS). Prostředek nejvyšší úrovně je fond clusterů a spravuje všechny clustery spuštěné ve stejném clusteru AKS. Při vytváření fondu clusterů se současně vytvoří základní cluster AKS pro hostování všech clusterů ve fondu. Fondy clusterů jsou logické seskupení clusterů, které pomáhají při vytváření robustní interoperability napříč několika typy clusterů a umožňují podnikům mít clustery ve stejné virtuální síti. Fondy clusterů poskytují rychlý a nákladově efektivní přístup ke všem typům clusterů vytvořeným na vyžádání a ve velkém měřítku. Jeden fond clusterů odpovídá jednomu clusteru v infrastruktuře AKS.

Clustery

Clustery jsou jednotlivé opensourcové výpočetní úlohy, jako jsou Apache Spark, Apache Flink a Trino, které je možné rychle vytvořit během několika minut s přednastavenými konfiguracemi a několika kliknutími. Přestože běží ve stejném fondu clusterů, může mít každý cluster vlastní konfigurace, jako je typ clusteru, verze, velikost virtuálního počítače uzlu, počet uzlů. Clustery běží na oddělených výpočetních prostředcích s vlastním DNS a koncovými body.

Funkce aktuálně ve verzi Preview

V následujícím seznamu tabulek jsou uvedeny funkce SLUŽBY HDInsight ve službě AKS, které jsou aktuálně ve verzi Preview. Funkce ve verzi Preview jsou seřazené abecedně.

Plocha Funkce
Základy Vytváření fondů a clusterů pomocí portálu , podpory ssh (Web Secure Shell), schopnost zvolit počet pracovních uzlů během vytváření clusteru
Úložiště Podpora ADLS Gen2 Storage
Metastore Podpora externího metastoru pro Trino, Spark a Flink, integrace se službou HDInsight
Zabezpečení Podpora ARM RBAC, podpora ověřování na základě MSI, možnost poskytnout přístup ke clusteru jiným uživatelům
Protokolování a monitorování Agregace protokolů v Azure Log Analytics pro protokoly serverů, metriky clusteru a služeb prostřednictvím spravované služby Prometheus a Grafana, metriky serveru podpory ve službě Azure Monitor, stránka Stav služby pro monitorování Stav služby
Automatické škálování Automatické škálování na základě zatížení a automatické škálování na základě plánu
Přizpůsobení a konfigurace clusterů Podpora akcí skriptů během vytváření clusteru, podpora správy knihoven, nastavení konfigurace služby po vytvoření clusteru
Trino Podpora pro katalogy Trino, podpora rozhraní příkazového řádku Trino, podpora DBeaveru pro odesílání dotazů, přidání nebo odebrání modulů plug-in a konektorů, podpora událostí protokolování dotazů, podpora statistiky dotazů pro libovolný konektor na řídicím panelu Trino, podpora řídicího panelu Trino pro monitorování dotazů, ukládání dotazů do mezipaměti, integrace s Power BI, integrace s Apache Superset, Redash, podpora více konektorů
Flink Podpora nativního webového uživatelského rozhraní Flink, podpora Flinku s HMS pro DStream, odesílání úloh do clusteru pomocí rozhraní REST API a webu Azure Portal, spouštění programů zabalených jako soubory JAR prostřednictvím Flink CLI, podpora trvalých bodů ukládání, podpora aktualizace možností konfigurace při spuštění úlohy, připojení k více službám Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestraation Manager, HDInsight Kafka, Odesílání úloh do clusteru pomocí Flink CLI a CDC pomocí Flink
Spark Jupyter Notebook, podpora delta lake 2.0, podpora Zeppelinu, podpora ATS, podpora rozhraní serveru historie Yarn, odesílání úloh pomocí SSH, odesílání úloh pomocí sady SDK a poznámkového bloku Machine Learning

Přehled funkcí

Funkce Odhadovaná časová osa vydání Stav
Automatické škálování – Na základě zatížení – Trino Q1 2024 Dokončeno
Automatické škálování založené na náhodném prohazování zatížení pro Spark Q2 2024 Probíhající
Místní upgrade Q2 2024 Dokončeno
Podpora rezervovaných instancí Q2 2024 Probíhající
Ověřování na základě MSI pro metastore (SQL) Q1 2024 Probíhající
Spark 3.4 Q2 2024 Probíhající
Trino 426 Q1 2024 Dokončeno
Ranger pro RBAC Q2 2024 Probíhající
Podpora režimu aplikace pro Flink Q1 2024 Dokončeno
Flink 1.17 Q1 2024 Dokončeno
Podpora Spark ACID Q1 2024 Probíhající
Konfigurovatelné skladové položky pro Headnode, SSH Q2 2024 Probíhající
Podpora Flink SQL Gateway Q1 2024 Dokončeno
Privátní clustery pro HDInsight v AKS Q1 2024 Dokončeno
Podpora Rangeru pro Spark SQL Q4 2024 Probíhající
Seznamy ACL rangeru ve vrstvě úložiště Q4 2024 Probíhající
Podpora one lake jako primárního kontejneru Q2 2024 Probíhající