Azure Databricks에 Power BI 연결
Microsoft Power BI는 셀프 서비스 비즈니스 인텔리전스 기능을 갖춘 대화형 시각화를 제공하는 비즈니스 분석 서비스입니다. 최종 사용자는 정보 기술 직원 또는 데이터베이스 관리자에게 의존하지 않고도 보고서와 대시보드를 직접 만들 수 있습니다.
Azure Databricks를 Power BI와 함께 데이터 원본으로 사용하는 경우 데이터 과학자 및 데이터 엔지니어를 넘어 모든 비즈니스 사용자가 Azure Databricks 성능 및 기술 장점을 활용할 수 있습니다.
Azure Databricks에서 Power BI Online에 게시
Power BI Online에서 Azure Databricks를 데이터 원본으로 사용하는 경우 Databricks UI에서 직접 테이블 또는 스키마에서 Power BI 데이터 세트를 만들 수 있습니다.
요구 사항
데이터는 Unity 카탈로그에 있어야 하며 컴퓨팅(클러스터)은 Unity 카탈로그를 사용하도록 설정해야 합니다. Hive 메타스토어는 현재 지원되지 않습니다.
프리미엄(프리미엄 용량 또는 사용자 단위 Premium 라이선스) Power BI 라이선스가 있어야 합니다.
Databricks에서 Power BI로 게시하는 데 사용하는 등록된 Entra ID 앱인 Databricks 데이터 세트 게시 통합에 다음 권한을 부여해야 합니다.
Content.Create
Dataset.ReadWrite.All
Workspace.Read.All
자세한 내용은 Microsoft Entra 권한을 참조하세요.
참고 항목
Entra 관리자 동의는 일반적으로 이러한 권한, 특히 Power BI의 작업 영역 및 데이터 세트 수준 액세스에 필요합니다. 지침은 관리자 동의 요청 검토를 참조하세요.
Power BI 작업 영역 설정에서 사용자가 Power BI 서비스(미리 보기)에서 데이터 모델을 편집하여 의미 체계 모델을 게시한 후 편집할 수 있도록 설정해야 합니다. XMLA 엔드포인트를 사용하여 연결을 만들어 테이블 형식 편집기를 사용하여 의미 체계 모델을 편집할 수도 있습니다.
Power BI 작업 영역에서 XML 쓰기를 사용하도록 설정해야 하는 경우 이 링크를 따라 지침을 확인하세요.
Power BI 작업 영역에서 프라이빗 링크를 사용하는 경우 Power BI에서 데이터 세트의 데이터 원본 자격 증명을 수동으로 업데이트해야 합니다.
Power BI 데이터 세트에 Azure Databricks 테이블 게시
Databricks 작업 영역에 로그인하고 사이드바에서 카탈로그를 클릭하여 카탈로그 탐색기를 엽니다.
오른쪽 위에 있는 드롭다운 목록에서 컴퓨팅 리소스를 선택합니다.
카탈로그를 열고 게시할 스키마 또는 테이블을 선택합니다. Hive 메타스토어 또는 샘플 카탈로그에서 선택하지 마세요.
오른쪽 위에서 스키마에 대해 BI 도구 사용을 클릭하거나 테이블에 대해 대시보드에서 열기를 클릭합니다.
Power BI 작업 영역에 게시를 선택합니다.
파트너에 연결 대화 상자에서 Microsoft Entra ID에 연결을 클릭하여 인증합니다.
Power BI 작업 영역에서 Power BI 작업 영역을 선택합니다.
데이터 세트 모드에서 DirectQuery 또는 가져오기를 선택합니다.
Power BI의 인증 방법에서 OAuth 또는 PAT(개인용 액세스 토큰)를 선택합니다.
Databricks는 세분화된 액세스 제어 및 사용자 수준 감사를 허용하기 때문에 OAuth를 사용하는 것이 좋습니다. 데이터 원본 자격 증명 아래의 Power BI 데이터 세트 설정 페이지에서 OAuth 자격 증명을 구성해야 할 수 있습니다. PAT(개인용 액세스 토큰)를 선택하면 Power BI가 의미 체계 모델에 액세스할 수 있도록 PAT가 사용자를 대신하여 생성됩니다.
데이터 세트 이름에서 새 데이터 집합으로 게시 또는 기존 데이터 집합 사용을 선택합니다.
기존 데이터 세트 사용을 선택하는 경우 다음이 true입니다.
- 데이터 세트가 존재하는 경우 덮어쓰지 않습니다. 업데이트는 지정된 스키마에 새 레코드만 추가합니다.
- 선택한 테이블이 기존 데이터 세트의 일부가 아닌 경우 추가됩니다.
- 테이블이 이미 데이터 세트에 있고 마지막 업데이트 후에 새 열이 추가된 경우 해당 열이 자동으로 추가됩니다.
- 새 테이블에 대해 다른 스토리지 모델을 선택하여 복합 의미 체계 모델을 만들 수 있습니다.
기존 데이터 연결을 유지하는 동안 업데이트하려는 기존 의미 체계 모델이 있는 경우 기존 데이터 세트 사용을 선택합니다. 새 의미 체계 모델을 사용하여 새 데이터 세트를 만들려면 새 데이터 세트로 게시를 선택합니다.
- 데이터 세트가 존재하는 경우 덮어쓰지 않습니다. 업데이트는 지정된 스키마에 새 레코드만 추가합니다.
Power BI에 게시를 클릭합니다.
데이터 세트가 게시된 후 10~20초 후에 Power BI 열기를 클릭하여 새 탭에서 Power BI 데이터 세트를 엽니다.
역할 및 메모
- 여러 테이블을 포함하는 스키마를 게시할 때 열이 있는 모든 테이블이 게시됩니다. 열이 없는 테이블은 게시되지 않습니다.
- Azure Databricks의 테이블 열에 대한 주석은 Power BI의 해당 열에 대한 설명으로 복사됩니다.
- 외래 키 관계는 게시된 데이터 세트에서 유지됩니다. 그러나 Power BI는 두 테이블 간에 하나의 활성 관계 경로만 지원합니다. Azure Databricks의 스키마에 여러 경로가 있는 경우 Power BI의 해당 관계 중 일부는 비활성으로 설정됩니다. 나중에 Power BI의 데이터 모델 보기에서 활성 또는 비활성 관계를 변경할 수 있습니다.
- OAuth 또는 온-프레미스 데이터 게이트웨이를 사용하는 경우 Power BI 데이터 세트 설정 페이지의 "데이터 원본 자격 증명"에서 자격 증명을 구성해야 할 수 있습니다.
- 현재 사용자는 홈 테넌트에서 Power BI 작업 영역에만 직접 게시할 수 있습니다. 게스트 사용자인 테넌트에서 게시는 지원되지 않습니다.
문제 해결
Error | 주의 |
---|---|
Power BI에 게시를 처음 시작할 때 "승인 필요" | 이 메시지가 표시되면 이 통합 기능에 대한 권한을 부여하려면 Entra 관리자의 승인이 필요합니다. 요청을 승인하려면 Entra 관리자에게 문의하세요. 이 링크에 따라 지침을 확인하세요. |
PowerBINotLicensedException | Power BI Premium 라이선스가 있는지 확인합니다. |
이 데이터 세트를 배포할 수 없습니다. 용량 관리자에게 문의하여 Power BI Premium 용량의 용량 설정에서 XMLA 읽기/쓰기 지원을 사용하도록 설정한 다음 다시 시도하세요. 자세한 내용은 제품 설명서의 'XMLA 읽기/쓰기 지원'을 참조하세요. | 용량 설정의 XMLA 엔드포인트에서 읽기 및 쓰기 기능을 사용하도록 설정하려면 Power BI 용량 관리자에게 문의하세요. 이 링크에 따라 지침을 확인하세요. |
XMLA 엔드포인트 기능이 비활성화되었습니다. 이 기능을 사용하려면 PowerBI.com에서 Excel에서 분석 기능을 활성화합니다. | 용량 설정의 XMLA 엔드포인트에서 읽기 및 쓰기 기능을 사용하도록 설정하려면 Power BI 용량 관리자에게 문의하세요. 이 링크에 따라 지침을 확인하세요. |
CapacityNotActive | 용량이 일시 중지될 수 있습니다. 용량 상태를 확인하려면 용량 관리자에게 문의하세요. |
이름이 ‘<ccon> ***</ccon> ’인 데이터베이스가 이미 ‘<ccon> 작업 영역 </ccon> ’ ***에 있습니다. |
의미 체계 모델을 만들 수 있는 권한이 있는지 확인합니다. 그런 다음 Power BI에 게시를 다시 시도하여 버전 번호가 증분된 의미 체계 모델을 게시합니다. |
Direct Lake 모드를 동일한 모델의 다른 스토리지 모드와 함께 사용할 수 없습니다. 복합 모델은 Direct Lake 모드를 지원하지 않습니다. 지원되지 않는 테이블을 제거하거나 Direct Lake 모드로 전환합니다. | Power BI에 게시는 가져오기 또는 DirectQuery 모드를 사용하여 의미 체계 모델을 생성하므로 Direct Lake 모드를 사용하는 기존 데이터 세트에 게시하는 데 사용할 수 없습니다. 자세히 알아보려면 이 링크를 클릭합니다. |
'<euii> *</euii> ' 사용자에게 Discover 메서드를 호출할 수 있는 권한이 없습니다. |
프리미엄 라이선스 모드를 사용하여 Power BI 작업 영역에 게시하고 있는지 확인합니다. 프로 라이선스 모드를 사용하여 작업 영역에 게시할 수 없습니다. |
‘<euii> </euii> ’ 사용자에게 ‘**에 새 개체를 만들 수 있는 권한이 없거나 개체가 없습니다. |
Power BI 작업 영역에서 뷰어 역할이 있을 수 있습니다. 의미 체계 모델을 만들 수 있는 권한이 있는지 확인합니다. 자세한 내용은 이 링크를 따라가세요. |
"데이터 원본 자격 증명을 업데이트하지 못했습니다. [Microsoft][ThriftExtension] (14) HTTP 연결 중 서버에서 예기치 않은 응답: 권한 없음/금지된 오류 응답이 반환되었지만 토큰 만료 메시지가 수신되지 않았습니다." Power BI에서 데이터 원본 자격 증명을 편집할 때 | Databricks 작업 영역에 공개적으로 액세스할 수 있는지 확인합니다. 작업 영역에서 프라이빗 링크 또는 IP 액세스 목록을 사용하는 경우 Power BI 온-프레미스 게이트웨이를 구성해야 할 수 있습니다. |
Azure Databricks에 Power BI Desktop 연결
Power BI Desktop울 Azure Databricks 클러스터 및 Databricks SQL 웨어하우스에 연결할 수 있습니다. Power BI 보고서를 Power BI 서비스에 게시하고 SSO(Single Sign-On)를 사용하여 사용자가 보고서에 액세스하는 데 사용하는 것과 동일한 Microsoft Entra ID 자격 증명을 전달하여 기본 Azure Databricks 데이터에 액세스할 수 있습니다.
요구 사항
Power BI Desktop 2.85.681.0 이상. Power BI에서 Unity 카탈로그에서 관리하는 데이터를 사용하려면 Power BI Desktop 2.98.683.0 이상(2021년 10월 릴리스)을 사용해야 합니다.
참고 항목
Power BI Desktop(Windows 필수). 다른 운영 체제의 대안은 물리적 호스트 또는 Windows 기반 가상 머신에서 Power BI Desktop 실행한 다음 운영 체제에서 연결하는 것입니다.
2.85.681.0 이전 버전의 Power BI Desktop을 사용하는 경우 Power BI Desktop 동일한 환경에서 Databricks ODBC 드라이버도 설치해야 합니다.
Azure Databricks 개인용 액세스 토큰 또는 Microsoft Entra ID 계정 자격 증명
참고 항목
보안 모범 사례로, 개인용 액세스 토큰을 사용하여 인증할 때 Databricks는 작업 영역 사용자 대신 서비스 주체에 속한 개인용 액세스 토큰을 사용할 것을 권장합니다. 서비스 주체에 대한 토큰을 만들려면 서비스 주체에 대한 토큰 관리를 참조하세요.
Partner Connect를 사용하여 Power BI Desktop을 Azure Databricks에 연결
Partner Connect를 사용하여 몇 번의 클릭만으로 Power BI Desktop에서 클러스터 또는 SQL 웨어하우스에 연결할 수 있습니다.
Azure Databricks 계정, 작업 영역 및 로그인한 사용자가 Partner Connect에 대한 요구 사항을 충족하는지 확인합니다.
사이드바에서 파트너 연결을 클릭합니다.
Power BI 타일을 클릭합니다.
파트너에 연결 대화 상자에서 컴퓨팅의 경우 연결하려는 Azure Databricks 컴퓨팅 리소스의 이름을 선택합니다.
연결 파일 다운로드를 선택합니다.
다운로드한 연결 파일을 열고 Power BI Desktop을 시작합니다.
Power BI Desktop에서 인증 자격 증명을 입력합니다.
- 개인용 액세스 토큰: Azure Databricks 개인용 액세스 토큰을 입력합니다.
- Microsoft Entra ID: 로그인을 클릭한 다음 화면의 지침을 따릅니다.
- 사용자 이름/암호: 해당 없음.
연결을 클릭합니다.
Power BI 탐색기에서 쿼리할 Azure Databricks 데이터를 선택합니다.
Power BI Desktop을 Azure Databricks에 수동으로 연결
다음 지침을 참조하여 선택한 인증 방법에 따라 Power BI Desktop을 사용하여 클러스터 또는 SQL 웨어하우스에 연결합니다. DirectQuery 모드에서 Power BI를 사용하는 경우 Databricks SQL 웨어하우스를 사용하는 것이 좋습니다.
참고 항목
Power BI Desktop을 사용하여 더 빠르게 연결하려면 Partner Connect를 사용합니다.
서버 호스트 이름 및 HTTP 경로를 가져옵니다.
Power BI Desktop을 시작합니다.
데이터 가져오기 또는 파일 > 데이터 가져오기를 클릭합니다.
시작하려면 데이터 가져오기를 클릭합니다.
Databricks를 검색한 다음 커넥터를 클릭합니다.
- Azure Databricks
연결을 클릭합니다.
서버 호스트 이름 및 HTTP 경로를 입력합니다.
데이터 연결 모드를 선택합니다. 가져오기와 DirectQuery의 차이점에 대한 자세한 내용은 Power BI Desktop에서 DirectQuery 사용을 참조하세요.
확인을 클릭합니다.
인증 방법을 클릭합니다.
- 개인용 액세스 토큰: Azure Databricks 개인용 액세스 토큰을 입력합니다.
- Microsoft Entra ID: 로그인을 클릭한 다음 화면의 지침을 따릅니다.
- 사용자 이름/암호: 해당 없음.
연결을 클릭합니다.
Power BI 탐색기에서 쿼리할 Azure Databricks 데이터를 선택합니다. 작업 영역에 Unity 카탈로그를 사용하도록 설정한 경우 스키마와 테이블을 선택하기 전에 카탈로그를 선택합니다.
사용자 지정 SQL 쿼리 사용
Databricks 커넥터는 사용자가 사용자 지정 SQL 쿼리를 제공할 수 있는 Databricks.Query
데이터 원본을 제공합니다.
Power BI Desktop을 사용하여 연결에서 설명된 단계에 따라 데이터 연결 모드로 가져오기를 사용하여 연결을 만듭니다.
탐색기에서 선택한 호스트 이름과 HTTP 경로가 포함된 최상위 항목을 마우스 오른쪽 단추로 클릭하고 데이터 변환을 클릭하여 Power Query 편집기를 엽니다.
함수 표시줄에서 함수 이름
Databricks.Catalogs
을(를)Databricks.Query
(으)로 바꾸고 변경 내용을 적용합니다. 이렇게 하면 SQL 쿼리를 매개 변수로 사용하는 Power Query 함수가 만들어집니다.매개 변수 필드에 SQL 쿼리를 입력하고 호출을 클릭합니다. 이렇게 하면 쿼리가 실행되고 쿼리 결과를 내용으로 사용하여 새 테이블이 만들어집니다.
Power BI 서비스를 사용하여 Azure Databricks 데이터 원본에 액세스
Power BI 서비스에 보고서를 게시할 때 개인용 액세스 토큰을 사용하여 Azure Databricks에 연결합니다. 또한 Power BI 서비스에서는 SSO(Single Sign On)를 활성화하여 사용자가 Microsoft Entra ID 자격 증명을 Azure Databricks에 전달하고 DirectQuery 저장 모드를 사용하여 빌드된 보고서에 액세스할 수 있습니다.
Power BI Desktop에서 Power BI 서비스로 Power BI 보고서를 게시합니다.
보고서 및 기본 데이터 원본에 대한 SSO(Single Sign-On) 액세스를 사용하도록 설정합니다.
- Power BI 서비스에서 보고서의 기본 Azure Databricks 데이터 세트로 이동하여 데이터 원본 자격 증명을 확장하고 자격 증명 편집을 클릭합니다.
- 구성 대화 상자에서 보고서 뷰어는 DirectQuery를 사용하여 자체 Power BI ID로 이 데이터 원본에만 액세스할 수 있습니다를 선택하고 로그인을 클릭합니다.
이 옵션을 선택하면 DirectQuery를 사용하여 데이터 원본에 대한 액세스가 처리되고 보고서에 액세스하는 사용자의 Microsoft Entra ID를 사용하여 관리됩니다. 이 옵션을 선택하지 않으면 보고서를 게시한 사용자만 Azure Databricks 데이터 원본에 액세스할 수 있습니다.
자동 HTTP 프록시 검색
Power BI Desktop 버전 2.104.941.0 이상(2022년 5월 릴리스)에는 Windows 시스템 차원의 HTTP 프록시 구성을 검색하기 위한 기본 제공 지원이 있습니다.
Power BI Desktop은 Windows 시스템 차원의 HTTP 프록시 구성을 자동으로 검색하고 사용할 수 있습니다.
프록시 서버가 CDP(CRL 배포 지점)를 제공하지 않는 경우 Power BI에서 다음과 같은 오류 메시지를 표시할 수 있습니다.
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
이 오류를 해결하려면 다음 단계를 완료합니다.
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
파일이 없으면 만듭니다.microsoft.sparkodbc.ini
파일에 다음 구성을 추가합니다.[Driver] CheckCertRevocation=0
Power BI Delta Sharing 커넥터
Power BI Delta Sharing 커넥터를 사용하면 Delta Sharing 개방형 프로토콜을 통해 공유된 데이터 세트를 검색, 분석 및 시각화할 수 있습니다. 이 프로토콜을 사용하면 REST 및 클라우드 스토리지를 활용하여 제품 및 플랫폼에서 데이터 세트를 안전하게 교환할 수 있습니다.
연결 지침은 Power BI: 공유 데이터 읽기를 참조하세요.
제한 사항
- Azure Databricks 커넥터는 웹 프록시를 지원합니다. 그러나 .pac 파일에 정의된 자동 프록시 설정은 지원되지 않습니다.
- Azure Databricks 커넥터에서
Databricks.Query
데이터 원본은 DirectQuery 모드와 함께 지원되지 않습니다. - Delta Sharing 커넥터가 로드하는 데이터는 머신의 메모리에 맞아야 합니다. 이를 위해 커넥터는 가져온 행 수를 이전에 설정한 행 제한으로 제한합니다.