HDInsight su AKS - Domande frequenti
Questo articolo affronta alcune domande comuni su Azure HDInsight su AKS.
Importante
Azure HDInsight su Azure Kubernetes Service (AKS) è stato ritirato il 31 gennaio 2025. Scopri di più con questo annuncio.
È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.
Importante
Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight su AKS. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguici per altri aggiornamenti su Community di Azure HDInsight.
Generale
Che cos'è HDInsight su AKS?
HDInsight su AKS è una nuova versione di HDInsight, che offre un servizio cluster gestito pronto per il livello aziendale con progetti open-source di analisi emergenti come Apache Flink (per lo streaming), Trino (per l'analisi ad-hoc e business intelligence) e Apache Spark. Per altre informazioni, vedere panoramica .
Quali tipi di cluster supporta HDInsight su AKS?
HDInsight su AKS supporta Trino, Apache Flink e Apache Spark per cominciare. Tuttavia, altre forme di cluster, come Kafka, Hive, ecc., sono nella roadmap.
Come si inizia a usare HDInsight su AKS?
Per iniziare, visitare Azure Marketplace e cercare Azure HDInsight nel servizio Azure HDInsight su AKS e fare riferimento a guida introduttiva.
Cosa accade a HDInsight esistente nella macchina virtuale e ai cluster attualmente in esecuzione?
Non sono state apportate modifiche a HDInsight esistente (HDInsight nella macchina virtuale). Tutti i cluster esistenti rimangono in esecuzione ed è possibile continuare a creare e scalare nuovi cluster HDInsight.
Quale sistema operativo è supportato con HDInsight su AKS?
HDInsight nel servizio Azure Kubernetes si basa sul sistema operativo Mariner. Per altre informazioni, vedere versione del sistema operativo.
In quali regioni è disponibile HDInsight su AKS?
Per un elenco delle aree supportate, vedere Disponibilità dell'area.
Qual è il costo per distribuire un HDInsight su un cluster AKS?
Per altre informazioni sui prezzi, vedere Prezzi di HDInsight su Azure Kubernetes Service (AKS).
Gestione dei cluster
È possibile eseguire più cluster contemporaneamente?
Sì, è possibile eseguire contemporaneamente tutti i cluster desiderati per ogni pool di cluster. ** Tuttavia, assicurati di non essere vincolati da una quota per il tuo abbonamento. Il numero massimo di nodi consentiti in un pool di cluster è 250 (in anteprima pubblica).
È possibile installare o aggiungere più plug-in/librerie nel cluster?
Sì, è possibile installare plug-in e librerie personalizzate a seconda delle forme del cluster.
- Per Trino, consultare Installare plug-in personalizzati.
- Per Spark, fare riferimento a la gestione della libreria in Spark.
È possibile connettersi tramite SSH al cluster?
Sì, è possibile connettersi tramite SSH al cluster tramite Webssh ed eseguire query e inviare processi direttamente da questa posizione.
Metastore
È possibile usare un metastore esterno per connettersi al cluster?
Sì, è possibile usare un metastore esterno. Tuttavia, è supportato solo il database SQL di Azure come metastore personalizzato esterno.
È possibile condividere un metastore tra più cluster?
Sì, è possibile condividere un metastore tra più HDInsight di Azure Kubernetes Service (AKS).
Qual è la versione del metastore Hive supportata?
Metastore Hive versione 3.1.2
Carichi
Trino
Che cos'è Trino?
Trino è un motore di query SQL federato e distribuito open source, che consente di eseguire query sui dati che risiedono in origini dati diverse senza passare a un data warehouse centrale. È possibile eseguire query sui dati usando ANSI SQL, senza dover apprendere un nuovo linguaggio. Per altre informazioni, vedere la panoramica di: Trino.
Quali connettori sono supportati?
HDInsight su AKS Trino supporta più connettori. Per ulteriori informazioni, consultare questo elenco di connettori Trino . Continuiamo ad aggiungere nuovi connettori come e quando sono disponibili nuovi connettori nella versione open source.
È possibile aggiungere cataloghi a un cluster esistente?
Sì, è possibile aggiungere cataloghi supportati al cluster esistente. Per altre informazioni, vedere Aggiungere cataloghi a un cluster esistente.
Apache Flink
Che cos'è Apache Flink?
Apache Flink è un motore di analisi open source di classe migliore per l'elaborazione dei flussi e l'esecuzione di calcoli con stato su flussi di dati non associati e delimitati. Può eseguire calcoli a velocità in memoria e su qualsiasi scala. Flink su HDInsight su AKS offre Apache Flink open source gestito. Per ulteriori informazioni, vedere la panoramica di Flink .
È supportata sia la modalità sessione che la modalità app in Apache Flink?
In HDInsight su AKS, Flink supporta attualmente i cluster in modalità sessione.
Che cos'è la gestione del backend dello stato e come viene eseguita in HDInsight su AKS?
I back-end determinano dove si archivia lo stato. Quando viene attivato il checkpointing, lo stato viene conservato sui checkpoint per evitare la perdita di dati e ripristinare in modo coerente. Il modo in cui lo stato è rappresentato internamente e come e dove viene conservato durante i checkpoint dipende dal back-end dello stato scelto. Per ulteriori informazioni, vedere la panoramica di Flink
Apache Spark
Che cos'è Apache Spark?
Apache Spark è un framework di elaborazione dati che può eseguire rapidamente attività di elaborazione su set di dati di grandi dimensioni e può anche distribuire attività di elaborazione dati in più computer, autonomamente o in combinazione con altri strumenti di elaborazione distribuiti.
Quali API del linguaggio sono supportate in Spark?
Azure HDInsight su AKS supporta Python e Scala.
I metastore esterni sono supportati in HDInsight su AKS Spark?
HDInsight su AKS supporta la connettività con il metastore esterno. Attualmente è supportato solo il database SQL di Azure come metastore esterno.
Quali sono i vari modi per inviare processi in HDInsight su AKS Spark?
È possibile inviare job su HDInsight su AKS Spark utilizzando Jupyter Notebook, Zeppelin Notebook, SDK e terminale del cluster. Per altre informazioni, vedere Inviare e gestire processi in un cluster Spark in HDInsight su AKS