Creare un cluster Spark in HDInsight su Azure Kubernetes Service (AKS) (Anteprima)

Articolo
09/20/2024

Importante

Azure HDInsight su Azure Kubernetes Service (AKS) è stato ritirato il 31 gennaio 2025. Scopri di più con questo annuncio.

È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.

Importante

Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight in anteprima su AKS. Per domande o suggerimenti sulle funzionalità, inviare una richiesta su AskHDInsight con i dettagli e seguire la Azure HDInsight Community su per altri aggiornamenti.

Dopo aver completato i prerequisiti della sottoscrizione e e i prerequisiti delle risorse e, e avete un pool di cluster distribuito, continua a utilizzare il portale di Azure per creare un cluster Spark. È possibile usare il portale di Azure per creare un cluster Apache Spark nel pool di cluster. È quindi possibile creare un notebook di Jupyter e usarlo per eseguire query Spark SQL sulle tabelle Apache Hive.

Nel portale di Azure, digitare "pool di cluster" e selezionarlo per accedere alla pagina dei pool di cluster. Nella pagina Pool di cluster selezionare il pool di cluster in cui è possibile aggiungere un nuovo cluster Spark.

Nella pagina del pool di cluster specifico, fare clic su + Nuovo cluster.

Questo passaggio apre la pagina di creazione del cluster.

Proprietà	Descrizione
Abbonamento	La sottoscrizione di Azure registrata per l'uso con HDInsight su AKS nella sezione Prerequisiti sarà precompilata.
Gruppo di risorse	Lo stesso gruppo di risorse del pool di cluster verrà popolato automaticamente
Regione	La stessa regione del pool di cluster e virtuale verranno prepopolate
Pool di cluster	Il nome del pool di cluster verrà precompilato
Versione del pool HDInsight	La versione del pool di cluster verrà prepopolata in base alla selezione durante la creazione del pool.
HDInsight su AKS versione	Specificare l'HDI nella versione di AKS
Tipo di cluster	Nell'elenco a discesa selezionare Spark
Versione cluster	Selezionare la versione dell'immagine da usare
Nome del cluster	Immettere il nome del nuovo cluster
Identità gestita assegnata dall'utente	Selezionare l'identità gestita assegnata dall'utente che funzionerà come stringa di connessione con l'archiviazione
Account di archiviazione	Selezionare l'account di archiviazione precedentemente creato che deve essere usato come risorsa di archiviazione primaria per il cluster
Nome contenitore	Selezionare il nome del contenitore (univoco) se è stato creato o creato un nuovo contenitore
Catalogo Hive (facoltativo)	Selezionare il metastore Hive creato in anteprima (database SQL di Azure)
Database SQL per Hive	Nell'elenco a discesa selezionare il database SQL in cui aggiungere tabelle hive-metastore.
Nome utente amministratore SQL	Immettere il nome utente dell'amministratore SQL
Archivio chiavi	Nell'elenco a discesa selezionare il Key Vault, che contiene una chiave segreta con la password per il nome utente dell'amministratore SQL.
Nome del segreto per la password SQL	Inserire il nome segreto nel Key Vault dove è memorizzata la password del database SQL

Nota

Attualmente HDInsight supporta solo i database MS SQL Server.
A causa della limitazione di Hive, il carattere "-" (trattino) nel nome del database metastore non è supportato.

Selezionare Avanti: Configurazione + Prezzi per continuare.

Proprietà	Descrizione
Dimensioni nodo	Selezionare le dimensioni del nodo da usare per i nodi Spark
Numero di nodi di lavoro	Selezionare il numero di nodi per il cluster Spark. Al di fuori di questi, tre nodi sono riservati per il coordinatore e i servizi di sistema, mentre i nodi rimanenti sono dedicati agli worker Spark, uno per nodo. Ad esempio, in un cluster a cinque nodi sono presenti due ruoli di lavoro
Scalabilità automatica	Fare clic sul pulsante Attiva/Disattiva per abilitare la scalabilità automatica
Tipo di scalabilità automatica	Selezionare una scalabilità automatica basata sul carico o sulla pianificazione
Timeout di disattivazione graduale	Specificare il timeout di dismissione graduale
Numero di nodi di lavoro predefiniti	Selezionare il numero di nodi per la scalabilità automatica
Fuso orario	Selezionare il fuso orario
Regole di scalabilità automatica	Selezionare il giorno, l'ora di inizio, l'ora di fine, no. dei nodi di lavoro
Abilitare SSH	Se abilitata, consente di definire il prefisso e il numero di nodi SSH

Fare clic su Avanti : Integrazioni per abilitare e selezionare Log Analytics per la registrazione.

È possibile abilitare Azure Prometheus per il monitoraggio e le metriche dopo la creazione del cluster.
Fare clic su Avanti: tag per passare alla pagina successiva.

Nella pagina Tag, inserire qualsiasi tag si desideri aggiungere alla risorsa.

Proprietà	Descrizione
Nome	Opzionale. Inserire un nome, come HDInsight nella Private Preview di AKS, per identificare facilmente tutte le risorse associate.
Valore	Lasciare vuoto questo campo
Risorsa	Selezionare Tutte le risorse selezionate

Fare clic su Avanti: Rivedi e crea.
Nella pagina Rivedi e creacercare il messaggio Convalida riuscita nella parte superiore della pagina e quindi fare clic su Crea.
Viene visualizzata la pagina di distribuzione , in cui è in corso di creazione il cluster. La creazione del cluster richiede 5-10 minuti. Dopo aver creato il cluster, viene visualizzato La distribuzione è stata completata messaggio. Se si esce dalla pagina, è possibile controllare lo stato delle notifiche.
Vai alla pagina di panoramica del cluster , lì è possibile visualizzare i collegamenti all'endpoint.

Condividi tramite

Creare un cluster Spark in HDInsight su Azure Kubernetes Service (AKS) (Anteprima)

Risorse aggiuntive