Sdílet prostřednictvím


Použití externího metastoru Hive pro fond Synapse Spark

Poznámka:

Po spuštění modulu Runtime Azure Synapse pro Apache Spark 3.4 v Synapse už nebudou externí metastory Hive podporovány v následujících verzích.

Azure Synapse Analytics umožňuje fondům Apache Sparku ve stejném pracovním prostoru sdílet spravovaný metastore Hive (HMS), který je kompatibilní s jejich katalogem. Pokud zákazníci chtějí zachovat metadata katalogu Hive mimo pracovní prostor a sdílet objekty katalogu s dalšími výpočetními moduly mimo pracovní prostor, jako je HDInsight a Azure Databricks, můžou se připojit k externímu metastoru Hive. V tomto článku se dozvíte, jak připojit Synapse Spark k externímu metastoru Apache Hive.

Podporované verze metastoru Hive

Tato funkce funguje se Sparkem 3.3. Následující tabulka uvádí podporované verze metastoru Hive pro každou verzi Sparku.

Verze Sparku HMS 2.3.x HMS 3.1.X
3.3 Ano Yes
3.4 Ano Yes

Nastavení propojené služby pro Metastore Hive

Poznámka:

Jako externí metastore Hive se podporují jenom Azure SQL Database a Azure Database for MySQL . Ověřování SQL (uživatelské jméno a heslo) je podporováno pro oba typy databází. Spravovaná identita (včetně systému sssigned a přiřazeného uživatelem) se navíc podporuje jenom pro Azure SQL Database a Spark 3.4. Pokud je zadaná databáze prázdná, zřiďte ji pomocí nástroje Schémata Hive a vytvořte schéma databáze.

Pomocí následujících kroků nastavte propojenou službu na externí metastore Hive v pracovním prostoru Synapse.

  1. Otevřete Synapse Studio, přejděte na Spravovat propojené služby vlevo a kliknutím na Nový vytvořte novou > propojenou službu.

    Snímek obrazovky s nastavením propojené služby Metastoru Hive

  2. Zvolte Azure SQL Database a klikněte na Pokračovat.

  3. Zadejte název propojené služby. Zaznamenejte název propojené služby, tyto informace se použijí ke konfiguraci Sparku za chvíli.

  4. Zvolte starší verzi a vyberte Připojovací řetězec.

  5. Vyberte Azure SQL Database pro externí metastore Hive ze seznamu předplatných Azure nebo zadejte informace ručně.

  6. Nastavit typ ověřování jako jeden z SQL Authenticationnebo System-assigned managed identityUser-assigned managed identity. Zadejte SQL Authenticationuživatelské jméno a heslo pro nastavení připojení. U System-assigned managed identitytéto stránky se automaticky naplní identita správy přidružená k aktuálnímu pracovnímu prostoru. Vyberte User-assigned managed identitynebo vytvořte přihlašovací údaje vázané na spravovanou identitu přiřazenou uživatelem.

  7. Otestujte připojení a ověřte ověřování.

  8. Kliknutím na Vytvořit vytvoříte propojenou službu.