Condividi tramite


Usare un Metastore di Hive esterno per il pool di Spark di Synapse

Nota

I metastore Hive esterni non saranno più supportati nelle versioni successive dopo Azure Synapse Runtime per Apache Spark 3.4 in Synapse.

Azure Synapse Analytics consente ai pool di Apache Spark nella stessa area di lavoro di condividere un metastore compatibile con il metastore Hive gestito come catalogo. Quando i clienti vogliono rendere persistenti i metadati del catalogo Hive all'esterno dell'area di lavoro e condividere oggetti catalogo con altri motori di calcolo all'esterno dell'area di lavoro, ad esempio HDInsight e Azure Databricks, possono connettersi a un Metastore Hive esterno. Questo articolo illustra come connettere Synapse Spark a un Metastore Apache Hive esterno.

Versioni del Metastore Hive supportate

La funzionalità funziona con Spark 3.3. La tabella seguente illustra le versioni di Metastore Hive supportate per ogni versione di Spark.

Versione Spark HMS 2.3.x HMS 3.1.X
3.3
3.4

Configurare il servizio collegato al Metastore Hive

Nota

Solo database SQL di Azure e Database di Azure per MySQL sono supportati come metastore Hive esterno. L'autenticazione SQL(username-password) è supportata per entrambi i tipi di database. Inoltre, le identità gestite,incluse l'autenticazione assegnata dal sistema e assegnata dall'utente, sono supportate solo per database SQL di Azure e Spark 3.4. Se il database specificato è vuoto, effettuarne il provisioning tramite lo strumento Hive Schema per creare lo schema del database.

Seguire questa procedura per configurare un servizio collegato all'archivio Metastore Hive esterno nell'area di lavoro di Synapse.

  1. Aprire Synapse Studio, andare a Gestisci >Servizi collegati a sinistra, fare clic su Nuovo per creare un nuovo servizio collegato.

    Screenshot della configurazione del servizio collegato Metastore Hive.

  2. Scegliere database SQL di Azure, fare clic su Continua.

  3. Specificare il nome del servizio collegato. Registrare il nome del servizio collegato; queste informazioni verranno usate per configurare Spark a breve.

  4. Scegliere Versione legacy e selezionare Stringa di connessione.

  5. Selezionare database SQL di Azure per il metastore Hive esterno dall'elenco delle sottoscrizioni di Azure oppure immettere le informazioni manualmente.

  6. Impostare Tipo di autenticazione come uno di SQL Authenticationo User-assigned managed identitySystem-assigned managed identity . Per SQL Authenticationspecificare nome utente e password per configurare la connessione. Per System-assigned managed identity, la pagina popola automaticamente l'identità di gestione associata all'area di lavoro corrente. Per User-assigned managed identity, selezionare o creare credenziali associate all'identità gestita assegnata dall'utente.

  7. Testare la connessione per verificare l'autenticazione.

  8. Fare clic su Crea per creare il servizio collegato.