다음을 통해 공유


Synapse Spark Pool에 외부 Hive Metastore 사용

참고 항목

Synapse에서 Apache Spark 3.4용 Azure Synapse 런타임 이후의 후속 버전에서는 외부 Hive 메타스토어가 더 이상 지원되지 않습니다.

Azure Synapse Analytics를 사용하면 동일한 작업 영역의 Apache Spark 풀에서 관리되는 HMS(Hive Metastore) 호환 메타스토어를 카탈로그로 공유할 수 있습니다. 고객이 작업 영역 외부에서 Hive 카탈로그 메타데이터를 유지하고 카탈로그 개체를 작업 영역 외부의 다른 계산 엔진(예: HDInsight 및 Azure Databricks)과 공유하려는 경우 외부 Hive Metastore에 연결할 수 있습니다. 이 문서에서는 Synapse Spark를 외부 Apache Hive Metastore에 연결하는 방법을 알아볼 수 있습니다.

지원되는 Hive Metastore 버전

이 기능은 Spark 3.3에서 작동합니다. 다음 표에서는 각 Spark 버전에 지원되는 Hive Metastore 버전을 보여 줍니다.

Spark 버전 HMS 2.3.x HMS 3.1.X
3.3
3.4

Hive Metastore에 연결된 서비스 설정

참고 항목

Azure SQL DatabaseAzure Database for MySQL외부 Hive Metastore로 지원됩니다. SQL(사용자 이름 암호) 인증은 두 종류의 데이터베이스 모두에 대해 지원됩니다. 또한 관리 ID(시스템 서명 및 사용자 할당 포함) 인증은 Azure SQL Database 및 Spark 3.4에 대해서만 지원됩니다. 제공된 데이터베이스가 비어 있는 경우 Hive Schema Tool을 통해 프로비전하여 데이터베이스 스키마를 만드세요.

아래 단계에 따라 Synapse 작업 영역에서 외부 Hive Metastore에 연결된 서비스를 설정합니다.

  1. Synapse Studio를 열고, 왼쪽의 관리 > 연결된 서비스로 차례로 이동한 다음, 새로 만들기를 클릭하여 새 연결된 서비스를 만듭니다.

    Hive Metastore 연결된 서비스 설정 스크린샷

  2. Azure SQL Database를 선택하고 계속을 클릭합니다.

  3. 연결된 서비스의 이름을 제공합니다. 연결된 서비스의 이름을 기록합니다. 이 정보는 곧 Spark를 구성하는 데 사용됩니다.

  4. 레거시 버전을 선택하고 연결 문자열을 선택합니다.

  5. Azure 구독 목록에서 외부 Hive Metastore에 대한 Azure SQL Database를 선택하거나 정보를 수동으로 입력합니다.

  6. 인증 유형을 하나 또는 .로 SQL Authentication설정합니다.User-assigned managed identitySystem-assigned managed identity 의 경우 SQL Authentication사용자 이름암호를 제공하여 연결을 설정합니다. 이 System-assigned managed identity경우 페이지는 현재 작업 영역과 연결된 관리 ID를 자동으로 채웁다. 의 경우 User-assigned managed identity사용자 할당 관리 ID로 바인딩된 자격 증명을 선택하거나 만듭니다.

  7. 연결을 테스트하여 인증을 확인합니다.

  8. 만들기를 클릭하여 연결된 서비스를 만듭니다.