Introduzione allo storage a cluster
Importante
Azure HDInsight su AKS è stato ritirato il 31 gennaio 2025. Scopri di più con questo annuncio.
È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.
Importante
Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire microsoft per altri aggiornamenti su community di Azure HDInsight.
Azure HDInsight su AKS può integrarsi facilmente con Archiviazione di Azure, una soluzione di archiviazione per utilizzo generico che funziona bene con molti altri servizi di Azure. Azure Data Lake Storage Gen2 (ADLS Gen 2) è il file system predefinito per i cluster.
L'account di archiviazione può essere usato come percorso predefinito per i dati, i log del cluster e altri output generati durante l'operazione del cluster. Potrebbe anche essere una risorsa di archiviazione predefinita per il catalogo Hive che dipende dal tipo di cluster.
Per altre informazioni, vedere Introduzione ad Azure Data Lake Storage Gen2.
Identità gestite per l'accesso sicuro ai file
Azure HDInsight in esecuzione su Azure Kubernetes Service (AKS) usa identità gestite (MSI) per proteggere l'accesso del cluster ai file in Azure Data Lake Storage Gen2. L'identità gestita è una funzionalità di Microsoft Entra ID che fornisce ai servizi di Azure un set di credenziali gestite automaticamente. Queste credenziali possono essere usate per eseguire l'autenticazione a qualsiasi servizio che supporti l'autenticazione di Active Directory. Inoltre, le identità gestite non richiedono l'archiviazione delle credenziali nei file di codice o di configurazione.
In Azure HDInsight su AKS, dopo aver selezionato un'identità gestita e uno spazio di archiviazione durante la creazione del cluster, l'identità gestita può lavorare senza problemi con l'archiviazione per la gestione dei dati, a condizione che il ruolo di Proprietario dei dati BLOB di Archiviazione sia assegnato all'identità gestita assegnata dall'utente.
La tabella seguente illustra le opzioni di archiviazione supportate per Azure HDInsight nel servizio Azure Kubernetes (anteprima pubblica):
Tipo di cluster | Archiviazione supportata | Connessione | Ruolo nell'archiviazione |
---|---|---|---|
Trino, Apache Flink e Apache Spark | ADLS Gen2 | Identità gestita assegnata dall'utente del cluster | L'identità del servizio gestito assegnata dall'utente deve avere il ruolo di Proprietario dei dati del BLOB di archiviazione nell'account di archiviazione. |
Nota
Per condividere un account di archiviazione tra più cluster, è sufficiente assegnare alla corrispondente MSI assegnata dall'utente del cluster il ruolo di "Proprietario dati BLOB di archiviazione" sull'account di archiviazione condiviso. Informazioni su come assegnare un ruolo.
Successivamente, è possibile usare il percorso di archiviazione completo abfs://
per accedere ai dati tramite le applicazioni.
Per altre informazioni, vedere Identità gestite per le risorse di Azure.
Scopri come creare un account ADLS Gen2.
Architettura di archiviazione di Azure HDInsight su AKS
Il diagramma seguente offre una visualizzazione astratta dell'architettura di Azure HDInsight nel servizio Azure Kubernetes di Archiviazione di Azure.
Gestione dell'archiviazione
Attualmente, Azure HDInsight su AKS non supporta gli account di archiviazione con eliminazione temporanea abilitata, assicurati di disabilitare eliminazione temporanea per il tuo account di archiviazione.