다음을 통해 공유


Azure Databricks와 DataGrip 통합

참고 항목

이 문서에서는 Databricks에서 제공하거나 지원하지 않는 DataGrip에 대해 설명합니다. 공급자에게 문의하려면 DataGrip 지원을 참조하세요.

DataGrip은 쿼리 콘솔, 스키마 탐색, 계획 설명, 스마트 코드 완성, 실시간 분석 및 빠른 수정, 리팩터링, 버전 제어 통합 및 기타 기능을 제공하는 데이터베이스 개발자용 IDE(통합 개발 환경)입니다.

이 문서에서는 로컬 개발 컴퓨터를 사용하여 DataGrip을 설치, 구성 및 사용하여 Azure Databricks에서 데이터베이스 작업을 수행하는 방법을 설명합니다.

참고 항목

이 문서는 macOS, Databricks JDBC Driver 버전 2.6.36 및 DataGrip 버전 2023.3.1로 테스트되었습니다.

요구 사항

DataGrip을 설치하기 전에 로컬 개발 컴퓨터가 다음 요구 사항을 충족해야 합니다.

  • Linux, macOS 또는 Windows 운영 체제.
  • 로컬 개발 컴퓨터에 Databricks JDBC 드라이버를 다운로드하고 다운로드한 DatabricksJDBC42-<version>.zip 파일에서 DatabricksJDBC42.jar 파일을 추출합니다.
  • DataGrip과 연결할 Azure Databricks 클러스터 또는 SQL 웨어하우스.

1단계: DataGrip 설치

DataGrip을 다운로드하여 설치합니다.

  • Linux: .zip 파일을 다운로드하고 콘텐츠를 추출한 다음 Install-Linux-tar.txt 파일의 지침을 따릅니다.
  • macOS: .dmg 파일을 다운로드하여 실행합니다.
  • Windows: .exe 파일을 다운로드하여 실행합니다.

자세한 내용은 DataGrip 웹 사이트에서 DataGrip 설치를 참조하세요.

2단계: DataGrip용 Databricks JDBC 드라이버 구성

이전에 다운로드한 Databricks JDBC 드라이버에 대한 정보로 DataGrip을 설정합니다.

  1. DataGrip을 시작합니다.
  2. 파일 > 데이터 원본을 클릭합니다.
  3. 데이터 원본 및 드라이버 대화 상자에서 드라이버 탭을 클릭합니다.
  4. +(드라이버) 단추를 클릭하여 드라이버를 추가합니다.
  5. 이름Databricks를 입력합니다.
  6. 일반 탭의 드라이버 파일 목록에서 +(추가) 단추를 클릭합니다.
  7. 사용자 지정 JAR을 클릭합니다.
  8. 이전에 추출한 DatabricksJDBC42.jar 파일을 찾아 선택한 다음 열기를 클릭합니다.
  9. 클래스의 경우 com.databricks.client.jdbc.Driver를 선택합니다.
  10. 확인을 클릭합니다.

3단계: Azure Databricks 데이터베이스에 DataGrip 연결

  1. DataGrip에서 파일 > 데이터 원본을 클릭합니다.

  2. 데이터 원본 탭에서 +(추가) 단추를 클릭합니다.

  3. 이전 단계에서 추가한 Databricks 드라이버를 선택합니다.

  4. 일반 탭의 URLAzure Databricks 리소스에 대한 JDBC URL 필드 값을 입력합니다. JDBC URL 필드 구문은 Databricks JDBC 드라이버에 대한 인증 설정을 참조하세요.

    참고 항목

    드라이버 기능 설정ConnCatalog JDBC URL에 지정해야 합니다. 그렇지 않으면 스키마를 식별할 수 없습니다.

  5. 연결 테스트를 클릭합니다.

    연결을 테스트하기 전에 리소스를 시작해야 합니다. 그렇지 않으면 리소스가 시작되는 동안 테스트를 완료하는 데 몇 분이 걸릴 수 있습니다.

  6. 연결이 성공하면 스키마 탭에서 액세스할 수 있는 스키마의 확인란(예: 모든 스키마)을 선택합니다.

  7. 확인을 클릭합니다.

DataGrip이 액세스할 각 리소스에 대해 이 단계의 지침을 반복합니다.

4단계: DataGrip을 사용하여 테이블 탐색

DataGrip을 사용하여 Azure Databricks 작업 영역의 테이블에 액세스합니다.

  1. DataGrip의 데이터베이스 창에서 리소스 노드를 확장하고 탐색할 스키마를 확장한 다음 테이블을 확장합니다.
  2. 테이블을 두 번 클릭합니다. 테이블의 첫 번째 행 집합이 표시됩니다.

추가 테이블에 액세스하려면 이 단계의 지침을 반복합니다.

다른 스키마의 테이블에 액세스하려면 데이터베이스 창의 도구 모음에서 데이터 원본 속성 아이콘을 클릭합니다. 데이터 원본 및 드라이버 대화 상자의 스키마 탭에서 액세스하려는 각 추가 스키마의 확인란을 선택한 다음 확인을 클릭합니다.

5단계: DataGrip을 사용하여 SQL 문 실행

DataGrip을 사용하여 카탈로그의 nyctaxi 스키마에서 samples 샘플 trips 테이블을 로드합니다.

  1. DataGrip에서 새 > SQL 파일 파일을> 클릭합니다.

  2. 파일 이름을 입력합니다(예: select_trips).

  3. 파일 탭에서 select_trips.sql 다음 SQL 문을 입력합니다.

    SELECT * FROM samples.nyctaxi.trips;
    
  4. SELECT 문을 선택합니다.

  5. 파일 탭의 도구 모음에서 실행 아이콘을 클릭합니다.

다음 단계

추가 리소스