다음을 통해 공유


효과적인 Genie 공간 큐레이팅

Important

이 기능은 공개 미리 보기 상태입니다.

Genie 공간을 큐레이팅하는 목적은 비즈니스 사용자가 자연어 질문을 제기하고 데이터에 기반하여 정확하고 일관된 답변을 얻을 수 있는 환경을 만드는 것입니다. Genie 공간은 정교한 쿼리를 생성하고 일반적인 세계 지식을 이해하는 고급 모델을 사용합니다.

대부분의 비즈니스 질문은 분야에 특정한 질문이므로 공간 큐레이터의 역할은 일반적인 환경 지식과 특정 분야 또는 특정 회사에서 사용되는 특수 언어 사이의 격차를 해소하는 것입니다. 큐레이터는 메타데이터와 지침을 사용하여 Genie가 비즈니스 사용자의 질문을 정확하게 해석하고 응답하는 데 도움을 줍니다. 이 문서에서는 성공적인 공간 개발을 안내하는 모범 사례 및 원칙을 간략하게 설명합니다.

새 공간을 정의하기 위한 모범 사례

다음 섹션에서는 효과적인 공간을 만드는 방법을 권장합니다.

작게 시작

Genie 공간 큐레이팅은 반복적인 프로세스입니다. 새 공간을 만들 때는 최소한의 지침과 답변할 수 있는 제한된 질문 집합을 사용하여 가능한 한 작게 시작합니다. 그런 다음, 피드백 및 모니터링에 따라 반복할 때 추가할 수 있습니다. 이 접근 방법은 공간을 만들고 유지 관리하는 작업을 간소화하는 데 도움이 되며, 이 방법을 통해 실제 사용자 요구 사항에 따라 효과적으로 큐레이팅할 수 있습니다.

다음 지침을 사용하여 작은 Genie 공간을 만듭니다.

  • 집중: 공간에서 처리할 질문에 답변하는 데 필요한 테이블만 포함합니다. 5개 이하의 테이블을 목표로 합니다. 선택에 더 집중할수록 더 좋습니다. 공간에서 적은 양의 데이터에 집중할 수 있도록 포함된 테이블의 열 수를 제한합니다.
  • 반복 계획: 필수 테이블 및 기본 지침에 중점을 두고 공간을 최소로 설정하는 것으로 시작합니다. 처음에 완벽을 목표로 하는 대신 시간이 지남에 따라 공간을 구체화할 때 더 자세한 지침과 예제를 추가합니다.
  • 주석이 잘 추가된 테이블 빌드: Genie는 Unity 카탈로그 열 이름 및 설명을 사용하여 응답을 생성합니다. 열 이름과 설명이 명확하면 고품질 응답을 생성할 수 있습니다. 열 설명은 정확한 컨텍스트 정보를 제공해야 합니다. 모호하거나 불필요한 세부 정보를 방지합니다. AI에서 생성된 설명이 정확하고 명확한지 검사하고, 사용자가 수동으로 제공할 내용에 부합하는 경우에만 사용합니다.

분야 전문가가 공간 정의

효과적인 공간 작성자는 데이터 및 데이터로부터 얻을 수 있는 인사이트를 이해해야 합니다. SQL에 능숙한 데이터 분석가는 일반적으로 공간을 큐레이팅하는 지식과 기술을 가지고 있습니다.

공간의 용도 정의

공간의 특정 대상 그룹 및 용도를 식별하면 사용할 데이터, 지침 및 테스트 질문을 결정하는 데 도움이 됩니다. 공간은 다양한 분야의 일반적인 질문이 아니라 특정 주제 및 대상 그룹에 대한 질문에 답변해야 합니다.

테스트 및 조정

공간의 첫 번째 사용자여야 합니다. 새 공간을 만든 후 질문하기 시작합니다. 질문에 대한 응답으로 생성된 SQL을 신중하게 검토합니다. Genie가 데이터, 질문 또는 비즈니스 전문 용어를 잘못 해석하는 경우 생성된 SQL을 편집하거나 다른 특정 지침을 제공하여 개입할 수 있습니다. 신뢰할 수 있는 응답을 받을 때까지 테스트 및 편집을 계속합니다.

질문을 검토한 후에는 전체 정확도를 위해 공간을 체계적으로 테스트하고 채점하는 데 사용할 수 있는 벤치마크 질문으로 추가할 수 있습니다. 변형 및 다양한 질문 구문을 사용하여 Genie의 응답을 테스트할 수 있습니다. Genie 공간에서 벤치마크 사용을 참조하세요.

잘못된 응답 수정에 대한 아이디어는 문제 해결을 참조하세요.

사용자 테스트 수행

테스트를 통해 응답 품질을 확인한 후 Genie 공간을 시도할 비즈니스 사용자를 모집합니다. 다음 지침을 사용하여 원활한 사용자 경험을 제공하고 지속적인 개선을 위한 피드백을 수집합니다.

  • 작업이 공간을 구체화하는 데 도움이 될 것이라는 기대치를 설정합니다.
  • 특정 주제에 대한 테스트에 집중하도록 요청하고 공간에서 답변하도록 디자인된 질문을 합니다.
  • 잘못된 응답을 받는 경우 사용자가 채팅에 추가 지침 및 설명을 추가하여 답변을 구체화하도록 장려합니다. 올바른 응답이 제공되면 향후 상호 작용에서 유사한 오류를 최소화하기 위해 최종 쿼리에 찬성해야 합니다.
  • 기본 제공 피드백 메커니즘을 사용하여 사용자에게 응답에 찬성하거나 반대하도록 지시합니다.
  • 추가 피드백 및 해결되지 않은 질문을 공간 작성자와 직접 공유하도록 사용자를 초대합니다. 작성자와 편집자는 피드백을 사용하여 지침, 예제 및 신뢰할 수 있는 자산을 구체화할 수 있습니다.

공간을 테스트하고 피드백을 제공하기 위한 지침이 단긴 서면 문서 또는 학습 자료를 제공하는 방법을 고려합니다. 비즈니스 사용자가 공간을 테스트할 때 기록 탭에 물어본 질문이 표시됩니다. Genie가 질문과 데이터를 올바르게 해석하여 정확한 답변을 제공할 수 있도록 지침을 계속 추가합니다. Genie 공간을 모니터링하는 방법에 대한 자세한 내용은 기록 및 피드백 검토를 참조하세요.

참고 항목

비즈니스 사용자는 공간에 액세스하려면 원래 작업 영역의 구성원이어야 합니다. 공간과 상호 작용할 수 있는 적절한 권한을 제공하는 방법을 알아보려면 필수 권한을 참조하세요.

문제 해결

다음 섹션에서는 일반적인 문제를 해결하는 방법을 간략하게 설명합니다.

오해의 소지가 있는 비즈니스 전문 용어

대부분의 회사 또는 분야에는 비즈니스 관련 이벤트에 대해 통신하는 데 사용하는 특정 약어가 있습니다. 예를 들어 연도를 언급할 때 항상 회계 연도를 의미할 수 있으며, 이 회계 연도는 1월이 아닌 2월 또는 3월에 시작될 수 있습니다. Genie가 이러한 질문에 자연스럽고 정확하게 답변할 수 있도록 하려면 비즈니스 전문 용어를 Genie가 이해할 수 있는 단어와 개념에 명시적으로 매핑하는 지침을 포함합니다. 지침 제공을 참조하세요.

잘못된 테이블 또는 열 사용

Genie가 잘못된 테이블에서 데이터를 가져오거나 잘못된 열에 대한 분석을 실행하려는 경우 다음 방법 중 하나로 데이터를 조정할 수 있습니다.

  • 명확하고 정확한 설명 제공: 테이블 및 관련 메타데이터를 확인하여 사용된 용어가 제출된 질문에서 사용자의 용어와 일치하는지 확인합니다. 그렇지 않은 경우 설명을 구체화하거나 테이블에 사용된 용어를 질문에 사용된 용어에 매핑하는 지침을 추가합니다.
  • 예제 쿼리 추가: Genie가 특정 질문에 응답하는 방법을 알아보는 데 사용할 수 있는 샘플 SQL 쿼리를 제공합니다. 지침 제공을 참조하세요.
  • 공간에서 테이블 또는 열 제거: 일부 테이블에는 Genie가 응답에 사용할 데이터를 이해하기 어렵게 하는 겹치는 열 또는 개념이 포함될 수 있습니다. 가능하면 불필요하거나 겹치는 테이블 또는 열을 제거합니다. 필요한 열만 포함하는 보기를 만들려고 할 수 있습니다.

필터링 오류

생성된 쿼리에는 특정 값에 따라 결과를 필터링하는 WHERE 절이 종종 포함됩니다. Genie는 실제 데이터에 대한 가시성이 없으므로 잘못된 값을 필터링하도록 WHERE 절을 설정할 수 있습니다. 예를 들어 테이블에서 "CA"와 같은 약어를 사용하는 경우 "California"라는 이름과 일치시킬 수 있습니다.

이와 같은 경우 다음 전략 중 하나를 시도합니다.

  • 열 값 집합이 비교적 작은 경우 각 열 설명에 유효한 문자열을 열거합니다. 특히 공백이나 숫자가 있는 경우 문자열 값을 따옴표로 묶습니다. 경우에 따라 일반적인 열거형의 경우 모든 상태 값을 나열하는 대신 "3자리 국가 ISO 코드 사용"이라는 설명으로도 충분합니다.

잘못된 조인

Unity 카탈로그에 외래 키 참조가 정의되지 않은 경우 공간은 서로 다른 테이블을 조인하는 방법을 모를 수 있습니다.

다음 솔루션 중 하나 이상의 구현을 시도합니다.

  • 가능하면 Unity 카탈로그에서 외래 키 참조를 정의합니다. CONSTRAINT 절을 참조하세요.
  • 테이블을 표준 방식으로 조인하는 예제 쿼리를 제공합니다.
  • 테이블의 외래 키 관계가 Unity 카탈로그에 지정되지 않은 경우 지침에서 이를 문서화합니다.

이러한 문제가 하나도 해결되지 않으면 테이블을 보기에 미리 조인하고 대신 공간에 대한 입력으로 사용합니다. 이 전략은 셀프 조인과 같은 더 복잡한 조인 시나리오에 유용합니다.

메트릭 계산 문제

메트릭을 계산하고 롤업하는 방식은 임의적으로 복잡할 수 있으며 공간에서 이해하지 못하는 많은 비즈니스 세부 정보를 포함할 수 있습니다. 이로 인해 잘못 보고할 수 있습니다.

다음 솔루션 중 하나 이상의 구현을 시도합니다.

  • 메트릭이 기본 테이블에서 집계되는 경우 각 롤업 값을 계산하는 예제 SQL 쿼리를 제공합니다.
  • 메트릭이 미리 계산되어 집계된 테이블에 있는 경우 테이블 메모에서 이를 설명합니다. 해당 테이블의 메트릭을 추가로 롤업할 수 있는 경우 각 메트릭에 대해 유효한 집계를 지정합니다.
  • 생성하려는 SQL이 매우 복잡한 경우 공간에 대한 메트릭을 이미 집계한 보기를 만들어 보세요.

지침 무시

메모에서 테이블과 열을 설명하고 일반 지침을 제공했더라도 공간이 여전히 이를 제대로 사용하지 못할 수 있습니다.

다음 전략 중 하나 이상을 시도합니다.

  • 테이블을 올바르게 사용하는 예제 쿼리를 제공합니다. 예제 쿼리는 데이터를 사용하는 방법을 공간에 가르치는 데 특히 효과적입니다.
  • 보다 간소화된 데이터 보기를 제공하는 테이블에서 보기를 만듭니다.
  • 지침을 검토하고 관련 없는 테이블 또는 지침을 제거하여 공간에 집중해 보세요.
  • 새 채팅을 시작해 보세요. 이전 상호 작용은 지정된 채팅에서 Genie의 응답에 영향을 줄 수 있지만 새 채팅을 시작하면 새 지침을 테스트하기 위한 빈 시작점이 제공됩니다.

성능 문제

Genie가 매우 긴 쿼리 또는 텍스트 응답을 생성해야 하는 경우 사고 단계에서 응답하는 데 시간이 오래 걸리거나 제한 시간이 초과될 수 있습니다.

성능을 개선하기 위해 다음 작업 중 하나 이상을 시도합니다.

  • 신뢰할 수 있는 자산 또는 보기를 사용하여 복잡한 쿼리를 캡슐화합니다. AI/BI Genie 공간에서 신뢰할 수 있는 자산 사용을 참조하세요.
  • 가능하면 예제 SQL 쿼리의 길이를 줄입니다.
  • Genie가 느리거나 실패한 응답을 생성하기 시작하면 새 채팅을 시작합니다.

중요 업무용 질문에 대한 신뢰할 수 없는 응답

신뢰할 수 있는 자산을 사용하여 사용자가 질문할 것으로 예상되는 특정 질문에 대한 검증된 답변을 제공합니다. AI/BI Genie 공간에서 신뢰할 수 있는 자산 사용을 참조하세요.

토큰 제한 경고

토큰은 Genie가 언어를 처리하고 이해하는 데 사용하는 텍스트의 기본 단위입니다. 지니 공간에서 지침 또는 메타데이터로 포함된 텍스트는 토큰으로 변환됩니다. 공간의 토큰 수가 한도에 가까워지면 제품에 경고가 표시됩니다. Genie는 스마트 컨텍스트 필터링을 적용하여 메타데이터를 나타내는 토큰과 Genie 공간에 포함된 일부 유형의 지침을 선택합니다. 제한을 초과하더라도 이 공간은 질문에 대한 응답을 계속 생성해야 합니다.

Genie 공간이 토큰 제한에 가까워지면 Genie는 테이블 스키마의 일부와 질문과 가장 관련된 지침만 포함하여 우선 순위를 지정할 수 있습니다. 이렇게 하면 중요한 컨텍스트가 필터링되는 경우 응답 품질이 저하될 수 있습니다. 토큰 수를 줄이려면 다음 방법을 고려하세요.

  • 불필요한 열 제거: 테이블의 불필요한 열이 토큰 사용에 크게 영향을 미칠 수 있습니다. 원시 테이블에서 중복 또는 중요하지 않은 필드를 제외하도록 보기를 만듭니다.
  • 열 설명 간소화: 열 설명은 중요하지만 열 이름으로 이미 전달된 정보가 중복되지 않도록 합니다. 예를 들어 열 이름이 account_name인 경우 "계정 이름"과 같은 설명은 중복될 수 있으며 생략할 수 있습니다.
  • 지침 간소화: 지침이 명확하고 간결한지 확인합니다. 불필요한 단어를 사용하지 않습니다.
  • 예제 SQL 문 정리: 다양한 유형의 질문을 다루지만 겹치거나 중복되는 예제를 제거하기 위해 다양한 범위의 예제 SQL 문을 포함합니다.

지역 간 처리를 사용할 수 없는 계정

Genie는 Azure Databricks에서 관리하는 지정된 서비스 입니다. 지정된 서비스는 Databricks Geos를 사용하여 데이터 상주를 관리합니다. 일부 지역의 경우 작업 영역과 동일한 지역에서 데이터를 처리할 수 없습니다. 작업 영역이 해당 지역 중 하나에 있는 경우 계정 관리자가 지역 간 처리를 사용하도록 설정해야 합니다.