Dela via


Använda externt Hive-metaarkiv för Synapse Spark-pool

Kommentar

Externa Hive-metaarkiv stöds inte längre i efterföljande versioner efter Azure Synapse Runtime för Apache Spark 3.4 i Synapse.

Azure Synapse Analytics gör att Apache Spark-pooler på samma arbetsyta kan dela ett hanterat HMS-kompatibelt metaarkiv (Hive Metastore) som katalog. När kunder vill bevara Hive-katalogmetadata utanför arbetsytan och dela katalogobjekt med andra beräkningsmotorer utanför arbetsytan, till exempel HDInsight och Azure Databricks, kan de ansluta till ett externt Hive-metaarkiv. I den här artikeln kan du lära dig hur du ansluter Synapse Spark till ett externt Apache Hive-metaarkiv.

Hive Metastore-versioner som stöds

Funktionen fungerar med Spark 3.3. I följande tabell visas de Hive Metastore-versioner som stöds för varje Spark-version.

Spark-version HMS 2.3.x HMS 3.1.X
3.3 Ja Ja
3.4 Ja Ja

Konfigurera länkad tjänst till Hive-metaarkiv

Kommentar

Endast Azure SQL Database och Azure Database for MySQL stöds som ett externt Hive-metaarkiv. SQL-autentisering (användarnamn-lösenord) stöds för båda typerna av databaser. Dessutom stöds hanterad identitet (inklusive systemtilldelad och användartilldelad) endast för Azure SQL Database och Spark 3.4. Om den angivna databasen är tom etablerar du den via Hive-schemaverktyget för att skapa databasschema.

Följ stegen nedan för att konfigurera en länkad tjänst till det externa Hive-metaarkivet i Synapse-arbetsytan.

  1. Öppna Synapse Studio, gå till Hantera > länkade tjänster till vänster, klicka på Ny för att skapa en ny länkad tjänst.

    Skärmbild av den länkade Hive Metastore-tjänsten.

  2. Välj Azure SQL Database och klicka på Fortsätt.

  3. Ange namnet på den länkade tjänsten. Registrera namnet på den länkade tjänsten. Den här informationen kommer att användas för att konfigurera Spark inom kort.

  4. Välj Äldre version och välj Anslutningssträng.

  5. Välj antingen Azure SQL Database för det externa Hive-metaarkivet från Azure-prenumerationslistan eller ange informationen manuellt.

  6. Ange autentiseringstyp som en av SQL Authentication, System-assigned managed identity eller User-assigned managed identity. För SQL Authenticationanger du Användarnamn och Lösenord för att konfigurera anslutningen. För System-assigned managed identityfyller sidan automatiskt i den hanteringsidentitet som är associerad med den aktuella arbetsytan. För User-assigned managed identityväljer eller skapar du en autentiseringsuppgift som är bunden till din användartilldelade hanterade identitet.

  7. Testa anslutningen för att verifiera autentiseringen.

  8. Klicka på Skapa för att skapa den länkade tjänsten.