Condividi tramite


Creare un cluster Spark in HDInsight su Azure Kubernetes Service (AKS) (Anteprima)

Importante

Azure HDInsight su Azure Kubernetes Service (AKS) è stato ritirato il 31 gennaio 2025. Scopri di più con questo annuncio.

È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.

Importante

Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight in anteprima su AKS. Per domande o suggerimenti sulle funzionalità, inviare una richiesta su AskHDInsight con i dettagli e seguire la Azure HDInsight Community su per altri aggiornamenti.

Dopo aver completato i prerequisiti della sottoscrizione e e i prerequisiti delle risorse e, e avete un pool di cluster distribuito, continua a utilizzare il portale di Azure per creare un cluster Spark. È possibile usare il portale di Azure per creare un cluster Apache Spark nel pool di cluster. È quindi possibile creare un notebook di Jupyter e usarlo per eseguire query Spark SQL sulle tabelle Apache Hive.

  1. Nel portale di Azure, digitare "pool di cluster" e selezionarlo per accedere alla pagina dei pool di cluster. Nella pagina Pool di cluster selezionare il pool di cluster in cui è possibile aggiungere un nuovo cluster Spark.

  2. Nella pagina del pool di cluster specifico, fare clic su + Nuovo cluster.

    Screenshot che mostra come creare un nuovo cluster Spark.

    Questo passaggio apre la pagina di creazione del cluster.

    screenshot che mostra la pagina di base per la creazione del cluster.

    Proprietà Descrizione
    Abbonamento La sottoscrizione di Azure registrata per l'uso con HDInsight su AKS nella sezione Prerequisiti sarà precompilata.
    Gruppo di risorse Lo stesso gruppo di risorse del pool di cluster verrà popolato automaticamente
    Regione La stessa regione del pool di cluster e virtuale verranno prepopolate
    Pool di cluster Il nome del pool di cluster verrà precompilato
    Versione del pool HDInsight La versione del pool di cluster verrà prepopolata in base alla selezione durante la creazione del pool.
    HDInsight su AKS versione Specificare l'HDI nella versione di AKS
    Tipo di cluster Nell'elenco a discesa selezionare Spark
    Versione cluster Selezionare la versione dell'immagine da usare
    Nome del cluster Immettere il nome del nuovo cluster
    Identità gestita assegnata dall'utente Selezionare l'identità gestita assegnata dall'utente che funzionerà come stringa di connessione con l'archiviazione
    Account di archiviazione Selezionare l'account di archiviazione precedentemente creato che deve essere usato come risorsa di archiviazione primaria per il cluster
    Nome contenitore Selezionare il nome del contenitore (univoco) se è stato creato o creato un nuovo contenitore
    Catalogo Hive (facoltativo) Selezionare il metastore Hive creato in anteprima (database SQL di Azure)
    Database SQL per Hive Nell'elenco a discesa selezionare il database SQL in cui aggiungere tabelle hive-metastore.
    Nome utente amministratore SQL Immettere il nome utente dell'amministratore SQL
    Archivio chiavi Nell'elenco a discesa selezionare il Key Vault, che contiene una chiave segreta con la password per il nome utente dell'amministratore SQL.
    Nome del segreto per la password SQL Inserire il nome segreto nel Key Vault dove è memorizzata la password del database SQL

    Nota

    • Attualmente HDInsight supporta solo i database MS SQL Server.
    • A causa della limitazione di Hive, il carattere "-" (trattino) nel nome del database metastore non è supportato.
  3. Selezionare Avanti: Configurazione + Prezzi per continuare.

    Screenshot che mostra la scheda prezzi 1.

    Screenshot che mostra la scheda prezzi 2.

    Screenshot che mostra la scheda SSH.

    Proprietà Descrizione
    Dimensioni nodo Selezionare le dimensioni del nodo da usare per i nodi Spark
    Numero di nodi di lavoro Selezionare il numero di nodi per il cluster Spark. Al di fuori di questi, tre nodi sono riservati per il coordinatore e i servizi di sistema, mentre i nodi rimanenti sono dedicati agli worker Spark, uno per nodo. Ad esempio, in un cluster a cinque nodi sono presenti due ruoli di lavoro
    Scalabilità automatica Fare clic sul pulsante Attiva/Disattiva per abilitare la scalabilità automatica
    Tipo di scalabilità automatica Selezionare una scalabilità automatica basata sul carico o sulla pianificazione
    Timeout di disattivazione graduale Specificare il timeout di dismissione graduale
    Numero di nodi di lavoro predefiniti Selezionare il numero di nodi per la scalabilità automatica
    Fuso orario Selezionare il fuso orario
    Regole di scalabilità automatica Selezionare il giorno, l'ora di inizio, l'ora di fine, no. dei nodi di lavoro
    Abilitare SSH Se abilitata, consente di definire il prefisso e il numero di nodi SSH
  4. Fare clic su Avanti : Integrazioni per abilitare e selezionare Log Analytics per la registrazione.

    È possibile abilitare Azure Prometheus per il monitoraggio e le metriche dopo la creazione del cluster.

    Screenshot che mostra la scheda di integrazione.

  5. Fare clic su Avanti: tag per passare alla pagina successiva.

    Screenshot che mostra la scheda tag.

  6. Nella pagina Tag, inserire qualsiasi tag si desideri aggiungere alla risorsa.

    Proprietà Descrizione
    Nome Opzionale. Inserire un nome, come HDInsight nella Private Preview di AKS, per identificare facilmente tutte le risorse associate.
    Valore Lasciare vuoto questo campo
    Risorsa Selezionare Tutte le risorse selezionate
  7. Fare clic su Avanti: Rivedi e crea.

  8. Nella pagina Rivedi e creacercare il messaggio Convalida riuscita nella parte superiore della pagina e quindi fare clic su Crea.

  9. Viene visualizzata la pagina di distribuzione , in cui è in corso di creazione il cluster. La creazione del cluster richiede 5-10 minuti. Dopo aver creato il cluster, viene visualizzato La distribuzione è stata completata messaggio. Se si esce dalla pagina, è possibile controllare lo stato delle notifiche.

  10. Vai alla pagina di panoramica del cluster , lì è possibile visualizzare i collegamenti all'endpoint.

    screenshot che mostra la pagina di panoramica del cluster.