Delen via


Externe Hive-metastore gebruiken voor Synapse Spark-pool

Notitie

Externe Hive-metastores worden niet meer ondersteund in volgende versies na Azure Synapse Runtime voor Apache Spark 3.4 in Synapse.

Azure Synapse Analytics stelt Apache Spark-pools in dezelfde werkruimte in staat om een beheerde HMS-compatibele metastore (Hive Metastore) te delen als hun catalogus. Wanneer klanten de metagegevens van de Hive-catalogus buiten de werkruimte willen behouden en catalogusobjecten willen delen met andere rekenkundige engines buiten de werkruimte, zoals HDInsight en Azure Databricks, kunnen ze verbinding maken met een externe Hive-metastore. In dit artikel leert u hoe u Synapse Spark verbindt met een externe Apache Hive-metastore.

Ondersteunde Hive Metastore-versies

De functie werkt met Spark 3.3. In de volgende tabel ziet u de ondersteunde Hive Metastore-versies voor elke Spark-versie.

Spark-versie HMS 2.3.x HMS 3.1.X
3.3 Ja Ja
3.4 Ja Ja

Gekoppelde service instellen voor Hive Metastore

Notitie

Alleen Azure SQL Database en Azure Database for MySQL worden ondersteund als een externe Hive-metastore. SQL-verificatie (gebruikersnaam-wachtwoord) wordt ondersteund voor beide soorten databases. Bovendien wordt beheerde identiteit (inclusief door het systeem toegewezen en door de gebruiker toegewezen) verificatie alleen ondersteund voor Azure SQL Database en Spark 3.4. Als de opgegeven database leeg is, richt u deze in via het Hive-schemaprogramma om een databaseschema te maken.

Volg de onderstaande stappen om een gekoppelde service in te stellen voor de externe Hive-metastore in de Synapse-werkruimte.

  1. Open Synapse Studio, ga naar Gekoppelde services beheren > aan de linkerkant en klik op Nieuw om een nieuwe gekoppelde service te maken.

    Schermopname van het instellen van een gekoppelde Hive Metastore-service.

  2. Kies Azure SQL Database en klik op Doorgaan.

  3. Geef de naam van de gekoppelde service op. Noteer de naam van de gekoppelde service. Deze informatie wordt binnenkort gebruikt om Spark te configureren.

  4. Kies de verouderde versie en selecteer Verbindingsreeks.

  5. Selecteer Azure SQL Database voor de externe Hive Metastore in de lijst met Azure-abonnementen of voer de gegevens handmatig in.

  6. Stel het verificatietype in als een van SQL Authentication, System-assigned managed identity of User-assigned managed identity. Geef SQL Authenticationde gebruikersnaam en het wachtwoord op om de verbinding in te stellen. Op System-assigned managed identityde pagina wordt automatisch de beheeridentiteit ingevuld die is gekoppeld aan de huidige werkruimte. Kies User-assigned managed identityof maak een referentie die is gebonden aan uw door de gebruiker toegewezen beheerde identiteit.

  7. Test de verbinding om de verificatie te controleren.

  8. Klik op Maken om de gekoppelde service te maken.