Co je nového ve službě HDInsight v AKS? (Preview)
Důležitý
Azure HDInsight v AKS byl vyřazen 31. ledna 2025. Zjistěte více prostřednictvím tohoto oznámení.
Abyste se vyhnuli náhlému ukončení úloh, musíte migrovat úlohy do Microsoft Fabric nebo ekvivalentního produktu Azure.
Důležitý
Tato funkce je aktuálně ve verzi Preview. Doplňkové podmínky použití pro verze Preview Microsoft Azure obsahují další právní podmínky, které se vztahují na funkce Azure, jež jsou v beta verzi, ve verzích Preview, nebo ještě nebyly vydány k obecné dostupnosti. Informace o této konkrétní verzi Preview najdete v tématu Azure HDInsight ve službě AKS ve verzi Preview. Pokud máte dotazy nebo návrhy funkcí, odešlete prosím žádost o AskHDInsight s podrobnostmi a sledujte nás pro další aktualizace v rámci komunity Azure HDInsight.
Ve službě HDInsight na AKS mají všechna správa a operace clusterů nativní podporu správy služeb na portálu Azure pro jednotlivé clustery.
Ve službě HDInsight v AKS jsou zavedeny dva nové koncepty:
- fondy clusterů slouží k seskupení a správě clusterů.
- Clustery se používají pro open source výpočetní prostředky, jsou hostované v rámci clusterového poolu.
Fondy clusterů
HDInsight v AKS běží ve službě Azure Kubernetes Service (AKS). Prostředkem nejvyšší úrovně je fond clusterů, který spravuje všechny clustery běžící na stejném clusteru AKS. Při vytváření fondu clusterů se současně vytvoří základní cluster AKS pro hostování všech clusterů ve fondu. Fondy clusterů jsou logické seskupení clusterů, které pomáhají při vytváření robustní interoperability napříč několika typy clusterů a umožňují podnikům mít clustery ve stejné virtuální síti. Fondy clusterů poskytují rychlý a nákladově efektivní přístup ke všem typům clusterů vytvořeným na vyžádání a ve velkém měřítku. Jeden fond clusterů odpovídá jednomu clusteru v infrastruktuře AKS.
Svazky
Clustery jsou jednotlivé opensourcové výpočetní úlohy, jako jsou Apache Spark, Apache Flink a Trino, které je možné rychle vytvořit během několika minut s přednastavenými konfiguracemi a několika kliknutími. Přestože běží ve stejném fondu clusterů, může mít každý cluster svou vlastní konfiguraci, jako je typ clusteru, verze, velikost uzlového virtuálního počítače a počet uzlů. Clustery běží na oddělených výpočetních prostředcích s vlastním DNS a koncovými body.
Funkce aktuálně ve verzi Preview
V následujícím seznamu tabulek jsou uvedeny funkce SLUŽBY HDInsight ve službě AKS, které jsou aktuálně ve verzi Preview. Funkce ve verzi Preview jsou seřazené abecedně.
Oblast | Vlastnosti |
---|---|
Základy | vytvoření fondu a clusterů pomocí portálu, podpory webového zabezpečeného prostředí (ssh), možnosti zvolit počet pracovních uzlů během vytváření clusteru |
Skladování | Podpora úložiště ADLS Gen2 |
Metastore | Podpora externího metastoru pro Trino, Spark a Flink, integrace s HDInsight |
Bezpečnost | Podpora ARM RBAC, podpora ověřování na základě MSI, možnost poskytnout přístup ke clusteru jiným uživatelům |
Protokolování a monitorování | Agregace protokolů ve službě Azure Log Analytics, pro protokoly serverů, metriky clusteru a služeb prostřednictvím spravovanýchPrometheus a Grafana, metriky serveru podpory v azure monitoru, stránka Stav služby pro monitorování Service Health |
Automatické škálování | automatické škálování podle zatíženía automatické škálování podle plánu |
Přizpůsobení a konfigurace clusterů | Podpora akcí skriptů během vytváření clusteru, podpora správy knihovny , nastavení konfigurace služby po vytvoření clusteru |
Trino | Podpora katalogů Trino, podpora rozhraní příkazového řádku Trino , podpora odesílání dotazů DBeaverem , přidání nebo odebrání pluginů a konektorů , podpora událostí protokolování dotazů , podpora statistik dotazu kontrole pro všechny Konektory na řídicím panelu Trino, podpora řídicího panelu Trino pro monitorování dotazů, podpora ukládání dotazů do mezipaměti , integrace s Power BI, integrace s Apache Supersetem , Redash, podpora více konektorů . |
Flink | Podpora nativního webového uživatelského rozhraní Flink, podpora Flink s HMS pro DStream, odesílání úloh do clusteru pomocí REST API a Azure portálu, spouštění programů zabalených jako soubory JAR prostřednictvím Flink CLI, podpora trvalých bodů ukládání, podpora aktualizace možností konfigurace během spuštění úlohy, připojení k více službám Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Správce orchestrace pracovních postupů Azure Data Factory, HDInsight Kafka, odesílání úloh do clusteru pomocí Flink CLI a CDC s Flinkem. |
Jiskra | Jupyter Notebook, podpora Delta Lake 2.0, podpora nástroje Zeppelin, podpora ATS, podpora rozhraní serveru historie Yarn, podpora odesílání úloh pomocí SSH, podpora odesílání úloh pomocí sady SDK a podpora Strojově-Learning Notebook |
Přehled funkcí
Funkce | Odhadovaný harmonogram vydání | Stav |
---|---|---|
automatické škálování – Na základě zatížení – Trino | 1. čtvrtletí 2024 | Hotový |
Automatické škálování se znalostí shuffle na základě zatížení pro Spark | 2. čtvrtletí 2024 | Probíhá |
Upgrade na místě | 2. čtvrtletí 2024 | Hotový |
Podpora rezervovaných instancí | 2. čtvrtletí 2024 | Probíhá |
Ověřování založené na MSI pro úložiště metadat (SQL) | 1. čtvrtletí 2024 | Probíhá |
Spark 3.4 | 2. čtvrtletí 2024 | Probíhá |
Trino 426 | 1. čtvrtletí roku 2024 | Hotový |
Ranger pro RBAC | 2. čtvrtletí 2024 | Probíhá |
podpora režimu aplikace pro Flink | 1. čtvrtletí 2024 | Hotový |
Flink 1.17 | 1. čtvrtletí 2024 | Hotový |
Podpora Spark ACID | 1. čtvrtletí 2024 | Probíhá |
Konfigurovatelné skladové položky pro Headnode, SSH | 2. čtvrtletí 2024 | Probíhá |
podpora služby Flink SQL Gateway | 1. čtvrtletí 2024 | Hotový |
Privátní Clustery pro HDInsight ve službě AKS | 1. čtvrtletí 2024 | Hotový |
Podpora Rangeru pro Spark SQL | 4. čtvrtletí 2024 | Probíhá |
ACLy Ranger ve vrstvě úložiště | 4. čtvrtletí 2024 | Probíhá |
Podpora one lake jako primárního kontejneru | 2. čtvrtletí 2024 | Probíhá |