다음을 통해 공유


근거 검색

근거 검색 API는 LLM(대규모 언어 모델)의 텍스트 응답이 사용자가 제공한 원본 자료에 기반을 두고 있는지 여부를 검색합니다. 근거 없음은 LLM이 원본 자료에 있던 것과는 달리 사실이 아니거나 부정확한 정보를 생성하는 경우를 나타냅니다.

주요 용어

  • RAG(검색 증강 생성): RAG는 LLM 지식을 다른 데이터로 보강하는 기술입니다. LLM은 광범위한 토픽에 대해 추론을 진행할 수 있지만 해당 지식은 학습되었을 당시에 사용 가능했던 퍼블릭 데이터로 제한됩니다. 프라이빗 데이터 또는 모델’중단 날짜 이후에 도입된 데이터에 대해 추론할 수 있는 AI 애플리케이션을 빌드하려면 해당 특정 정보를 모델에 제공해야 합니다. 적절한 정보를 가져와서 모델 프롬프트에 삽입하는 프로세스를 RAG(검색 증상 생성)라고 합니다. 자세한 내용은 RAG(검색 증강 생성)을 참조하세요.
  • LLM의 근거 및 근거 없음: 모델 출력이 제공된 정보를 기준으로 하거나 신뢰할 수 있는 원본을 정확하게 반영하는 정도를’나타냅니다. 근거가 있는 응답은 지정된 정보를 밀접하게 따름으로써 추측이나 조작을 피합니다. 근거 측정에서 원본 정보는 매우 중요하며 근거 원본 역할을 합니다.

근거 감지 옵션

Azure AI 콘텐츠 안전에서 접지 검색에 사용할 수 있는 옵션은 다음과 같습니다.

  • 도메인 선택: 사용자는 설정된 도메인을 선택하여 필드의 특정 요구 사항에 맞는 맞춤형 검색을 보장할 수 있습니다. 현재 사용 가능한 도메인은 MEDICALGENERIC입니다.
  • 작업 사양: 이 기능을 사용하면 작업 유형에 따라 조정 가능한 설정을 사용하여 QnA(질문 및 답변) 및 요약과 같이 수행 중인 작업을 선택할 수 있습니다.
  • 속도 및 해석력: 속도와 결과 해석력을 절충하는 두 가지 모드가 있습니다.
    • 비추론 모드: 온라인 애플리케이션에 쉽게 포함할 수 있는 빠른 검색 기능을 제공합니다.
    • 추론 모드: 더 잘 이해하고 문제를 완화하기 위해 검색된 근거 없는 세그먼트에 대한 자세한 설명을 제공합니다.

사용 사례

근거 검색은 생성된 요약 또는 답변이 정확하고 신뢰할 수 있도록 텍스트 기반 요약 및 QnA 작업을 지원합니다. 다음은 각 사용 사례의 몇 가지 예입니다.

요약 작업:

  • 의료 요약: 의료 뉴스 기사의 컨텍스트에서, 근거 검색을 사용하여 요약에 조작되거나 오해의 소지가 있는 정보가 포함되지 않도록 함으로써 독자가 정확하고 신뢰할 수 있는 의료 정보를 얻을 수 있도록 보장할 수 있습니다.
  • 학술 논문 요약: 모델이 학술 논문 또는 연구 문서의 요약을 생성하는 경우 이 기능을 사용하면 거짓 주장을 도입하지 않고 요약된 콘텐츠가 주요 결과 및 기여도를 정확하게 나타내는 데 도움이 될 수 있습니다.

QnA 작업:

  • 고객 지원 챗봇: 고객 지원 서비스에서 이 기능을 사용하여 AI 챗봇에서 제공하는 답변의 유효성을 검사하여 고객이 제품 또는 서비스에 대해 질문할 때 정확하고 신뢰할 수 있는 정보를 받도록 할 수 있습니다.
  • 의료 QnA: 의료 QnA의 경우 이 기능은 AI 시스템에서 의료 전문가 및 환자에게 제공하는 의료 답변 및 조언의 정확성을 확인하여 의료 오류의 위험을 줄이는 데 도움이 됩니다.
  • 교육 QnA: 교육 설정에서 이 기능을 QnA 작업에 적용하여 학술 질문 또는 테스트 준비 쿼리에 대한 답변이 실제로 정확한지 확인하여 학습 프로세스를 지원할 수 있습니다.

근거 수정

근거 감지 API에는 제공된 근거 원본을 기반으로 텍스트에서 감지된 모든 근거 없는 항목을 자동으로 수정하는 수정 기능이 포함되어 있습니다. 수정 기능을 사용하도록 설정하면 응답에 근거 원본에 맞춰 수정된 텍스트를 표시하는 corrected Text 필드가 포함됩니다.

사용 사례

아래에서 최상의 결과를 얻기 위해 이러한 기능을 적용하는 방법과 시기를 보여 주는 몇 가지 일반적인 시나리오를 참조하세요.

의료 컨텍스트의 요약

의료 문서를 요약하는 경우 요약에 포함된 환자 이름이 정확하고 제공된 근거 원본과 일치하는 것이 중요합니다.

API 요청 예:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

예상되는 결과:

수정 기능은 Kevin이 근거 원본 Jane과 충돌하기 때문에 근거가 없음을 감지합니다. API는 다음과 같은 수정된 텍스트를 반환합니다. "The patient name is Jane."

고객 지원 데이터를 사용하는 QnA(질문 및 답변) 작업

고객 지원 챗봇에 대한 QnA 시스템을 구현하고 있습니다. AI가 제공하는 답변은 가장 최신의 정확한 정보와 일치해야 합니다.

API 요청 예:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

예상되는 결과:

API는 5%가 제공된 근거 원본 4.5%와 일치하지 않으므로 근거가 없음을 감지합니다. 응답에는 다음과 같은 상관 관계 텍스트가 포함됩니다. "The interest rate is 4.5%."

기록 데이터를 사용한 콘텐츠 만들기

신뢰성을 유지하고 잘못된 정보를 방지하는 데 정확도가 중요한 기록 데이터 또는 이벤트가 포함된 콘텐츠를 만들고 있습니다.

API 요청 예:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

예상되는 결과:

API는 접지되지 않은 날짜를 1065 검색하고 접지 원본에 따라 수정합니다 1066 . 응답에는 다음과 같은 수정된 텍스트가 포함됩니다. "The Battle of Hastings occurred in 1066."

내부 설명서 요약

제품 이름, 버전 번호 또는 기타 특정 데이터 요소가 일관성을 유지해야 하는 내부 문서를 요약하고 있습니다.

API 요청 예:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

예상되는 결과:

수정 기능은 비경관으로 식별 SuperWidget v2.1 되어 응답에서 업데이트합니다 SuperWidget v2.2 . 응답에는 다음과 같은 수정된 텍스트가 반환됩니다. "Our latest product is SuperWidget v2.2."

모범 사례

근거 감지 API의 성능을 최대한 활용하려면 RAG 시스템을 설정할 때 다음 모범 사례를 준수합니다.

  • 제품 이름이나 버전 번호를 다룰 때는 내부 릴리즈 노트 또는 공식 제품 문서에서 직접 근거 원본을 사용하여 정확성을 확보합니다.
  • 기록 콘텐츠의 경우, 신뢰할 수 있는 학술 또는 기록 데이터베이스와 근거 원본을 상호 참조하여 최고 수준의 정확성을 보장합니다.
  • 금융과 같이 상황이 수시로 변하는 환경에서는 항상 가장 최신의 신뢰할 수 있는 근거 원본을 사용하여 AI 시스템이 정확하고 시의적절한 정보를 제공하도록 합니다.
  • 특히 의료와 같이 민감한 분야에서는 항상 근거 원본이 정확하고 최신 상태인지 확인합니다. 이렇게 하면 요약 프로세스에서 오류의 위험이 최소화됩니다.

제한 사항

언어 가용성

현재 근거 검색 API는 영어 콘텐츠를 지원합니다. API는 영어가 아닌 콘텐츠의 제출을 제한하지 않지만 다른 언어 콘텐츠 분석에서 동일한 수준의 품질과 정확도를 보장할 수는 없습니다. API에서 가장 신뢰할 수 있고 정확한 결과를 얻으려면 사용자가 주로 영어로 콘텐츠를 제출하는 것이 좋습니다.

텍스트 길이 제한 사항

최대 텍스트 길이 제한 사항은 입력 요구 사항을 참조하세요.

사용 가능 지역

이 API를 사용하려면 지원되는 지역에서 Azure AI 콘텐츠 보안 리소스를 만들어야 합니다. 지역 가용성을 참조하세요.

속도 제한 사항

쿼리 속도를 참조하세요.

더 높은 요금이 필요한 경우 문의하여 요청하세요.

다음 단계

빠른 시작에 따라 Azure AI 콘텐츠 보안을 사용하여 근거를 검색합니다.