다음을 통해 공유


쿼리 프로필

쿼리 프로필을 사용하여 쿼리 실행의 세부 정보를 시각화할 수 있습니다. 쿼리 프로필은 쿼리 실행 중 성능 병목 상태 문제를 해결하는 데 도움이 됩니다. 예시:

  • 각 쿼리 연산자 및 관련 메트릭(예: 소요된 시간, 처리된 행 수, 처리된 행 수 및 메모리 사용량)을 시각화할 수 있습니다.
  • 쿼리 실행의 가장 느린 부분을 한 눈에 식별하고 쿼리 수정의 영향을 평가할 수 있습니다.
  • 조인 분해 또는 전체 table 검사와 같은 SQL 문에서 일반적인 실수를 검색하고 수정할 수 있습니다.

요구 사항

쿼리 프로필을 보려면 쿼리의 소유자이거나 쿼리를 실행한 SQL 웨어하우스에 대한 CAN MONITOR 권한이 있어야 합니다.

쿼리 프로필 보기

다음 단계를 사용하여 쿼리 기록에서 쿼리 프로필을 볼 수 있습니다.

  1. 쿼리 기록을 봅니다.

  2. 쿼리의 이름을 클릭합니다. 화면 오른쪽에 쿼리 세부 정보 패널이 나타납니다.

    쿼리 실행 요약 단순 보기

  3. 쿼리 프로필 보기를 클릭합니다.

    참고 항목

    쿼리 프로필을 사용할 수 없음이 표시될 경우 이 쿼리에 사용할 수 있는 프로필이 없습니다. 쿼리 캐시에서 실행되는 쿼리에는 쿼리 프로필을 사용할 수 없습니다. 쿼리 캐시를 회피하려면 LIMIT를 변경하거나 제거하는 것과 같이 쿼리를 약간 변경합니다.

  4. 그래프 보기(기본값)에서 쿼리 프로필을 보려면 그래프 보기를 클릭합니다. 쿼리 프로필을 트리로 보려면 트리 보기를 클릭합니다.

    • 그래프 보기는 노드 간에 데이터가 흐르는 방식을 시각화하는 데 최적화되어 있습니다.
    • 트리 뷰는 가장 오래 실행 중인 연산자 식별과 같이, 쿼리 성능 문제를 신속하게 찾는 데 최적화되어 있습니다.
  5. 그래프 보기 또는 트리 보기에서 페이지 맨 위에 있는 탭 중 하나를 클릭하여 각 쿼리 연산자의 세부 정보를 볼 수 있습니다.

    • 소요 시간: 각 작업에 소요된 집계된 시간입니다. 작업의 총 시간도 제공됩니다.
    • 행: 각 쿼리 연산자의 영향을 받는 행의 수와 크기입니다.
    • 최대 메모리: 각 쿼리 연산자가 사용한 최대 메모리입니다.

    참고 항목

    일부 비Photon 작업은 그룹으로 실행되고 공통 메트릭을 공유합니다. 이 경우 모든 작업에는 지정된 메트릭에 대한 부모 연산자의 값이 동일합니다.

  6. 그래프 보기에서 연산자를 클릭하여 자세한 메트릭을 표시할 수 있습니다. 트리 뷰에서 연산자의 이름을 클릭하여 관련 세부 정보를 볼 수 있습니다.

  7. 각 노드는 해당 작업으로 레이블이 지정됩니다. 기본적으로 일부 작업에 대한 메트릭은 숨겨집니다. 이러한 작업은 성능 병목 상태의 원인이 될 가능성이 낮습니다. 모든 작업에 대한 정보를 확인하고 추가 메트릭을 보려면 페이지 위쪽을 클릭한 케밥 메뉴 다음 자세한 정보 표시 모드 사용을 클릭합니다. 가장 일반적인 작업은 다음과 같습니다.

    • 검사: 데이터 원본에서 데이터를 읽고 행으로 출력했습니다.
    • Join: 여러 관계의 행이 하나의 행 set 결합(인터리브)되었습니다.
    • Union: 동일한 schema을 사용하는 여러 관계에서 가져온 행들이 단일 set으로 병합되었습니다.
    • 순서 섞기: 데이터가 재배포되거나 다시 분할되었습니다. 순서 섞기 작업은 클러스터의 실행기 간에 데이터를 이동하기 때문에 리소스와 관련하여 비용이 많이 듭니다.
    • 해시/정렬: 행은 키별로 그룹화되고 각 그룹 내에서 SUM, COUNT 또는 MAX와 같은 집계 함수를 사용하여 평가되었습니다.
    • 필터: WHERE 절과 같은 기준에 따라 입력이 필터링되고 행의 하위 집합이 반환됩니다.
    • (재사용) 교환: 순서 섞기 또는 브로드캐스트 교환은 원하는 분할을 기반으로 클러스터 노드 간에 데이터를 재배포하는 데 사용됩니다.
    • Limit 수집: LIMIT 문장을 사용하여 반환된 행 수가 제한되었습니다.
    • 순서 지정 및 프로젝트: 쿼리 결과의 상위 N개 행이 반환되었습니다.
  8. (선택 사항) Databricks SQL 쿼리의 경우 Apache Spark UI에서 쿼리 프로필을 볼 수도 있습니다. 케밥 메뉴 페이지 맨 위에 있는 케밥 메뉴를 클릭한 다음 Spark UI에서 열기를 클릭합니다.

  9. 쿼리 프로필을 닫려면 패널 아래쪽에서 쿼리 프로필 숨기기를 클릭합니다.

UI의 다음 부분에서 쿼리 프로필에 액세스할 수도 있습니다.

  • SQL 편집기: 쿼리가 완료되면 페이지 아래쪽에 있는 링크에 경과된 시간과 반환된 행 수가 표시됩니다. 해당 링크를 클릭하여 쿼리 세부 정보 패널을 엽니다. 쿼리 프로필 보기를 클릭합니다.

    편집기 출력에서 쿼리 기록 열기

    참고 항목

    새 SQL 편집기를 사용하도록 설정한 경우(공개 미리 보기) 링크가 Notebook에서와 같이 표시됩니다.

  • Notebook에서: Notebook이 SQL 웨어하우스 또는 서버리스 컴퓨팅에 연결된 경우 쿼리가 포함된 셀 아래의 링크를 사용하여 쿼리 프로필에 액세스할 수 있습니다. 성능 보기를 클릭하여 실행 기록을 엽니다. 문을 클릭하여 쿼리 세부 정보 패널을 엽니다.

    쿼리 기록 Notebook 출력 열기

  • Delta Live Tables 파이프라인 UI: 파이프라인 UI의 쿼리 기록 탭에서 쿼리 기록 및 프로필에 액세스할 수 있습니다. Delta Live 파이프라인 대한 액세스 쿼리 기록을 참조하세요.

  • 작업 UI에서: 서버리스 작업에만 적용됩니다. 작업 UI에서 쿼리 프로필을 여는 방법을 알아보려면 워크플로에 대한 서버리스 컴퓨팅을 사용하여 Azure Databricks 작업 실행을 참조하세요.

쿼리 프로필에 대한 세부 정보 보기

쿼리 프로필은 쿼리의 최상위 연산자를 역순으로 나열하고 마지막 연산자가 먼저 나열됩니다. 다음 단계를 사용하여 쿼리 프로필의 여러 부분을 숙지합니다.

  1. 쿼리 프로필 보기의 맨 위에 있는 소요 시간, 최대 메모리 단추를 사용하여 각 범주의 최상위 메트릭을 확인합니다.
  2. 연산자를 클릭하여 기간에 대한 설명 및 메트릭, 사용된 메모리, 반환된 행의 수 및 크기, 사용된 그룹화 및 집계 식 또는 출력 특성과 같은 작업에 대한 세부 정보를 봅니다.
  3. 연산자 세부 정보를 닫려면 쿼리 세부 정보로 돌아가기를 클릭합니다.
  4. 쿼리 프로필을 닫려면 오른쪽 패널 아래쪽에 있는 쿼리 프로필 숨기기를 클릭합니다.

쿼리 프로필 공유

쿼리 프로필을 다른 사용자와 공유하려면 다음을 수행합니다.

  1. 쿼리 기록을 봅니다.
  2. 쿼리의 이름을 클릭합니다.
  3. 쿼리를 공유하려면 다음 두 가지 선택 사항이 있습니다.
    • 다른 사용자에게 쿼리에 대한 CAN MANAGE 권한이 있는 경우 쿼리 프로필의 URL을 공유할 수 있습니다. 공유를 클릭합니다. URL이 클립보드에 복사됩니다.
    • 그렇지 않으면 다른 사용자에게 CAN MANAGE 권한이 없거나 작업 영역의 멤버가 아닌 경우 쿼리 프로필을 JSON 개체로 다운로드할 수 있습니다. 다운로드. JSON 파일이 로컬 시스템에 다운로드됩니다.

쿼리 프로필 가져오기

쿼리 프로필에 대한 JSON을 가져오려면 다음을 수행합니다.

  1. 쿼리 기록을 봅니다.

  2. 오른쪽 위에 있는 케밥 메뉴 케밥 메뉴를 클릭하고, 쿼리 프로필 가져오기 (JSON)를 클릭합니다.

  3. 파일 브라우저에서 사용자와 공유된 JSON 파일을 선택하고 select 열기 을 클릭합니다. JSON 파일이 업로드되고 쿼리 프로필이 표시됩니다.

    쿼리 프로필을 가져오면 브라우저 세션에 동적으로 로드되고 작업 영역에서 유지되지 않습니다. 볼 때마다 다시 가져와야 합니다.

  4. 가져온 쿼리 프로필을 닫으려면 페이지 맨 위에 있는 X를 클릭합니다.

다음 단계