QnA Maker용 Azure 리소스
QnA Maker는 각각 다른 용도로 사용되는 여러 Azure 원본을 사용합니다. 이를 개별적으로 사용하는 방법을 이해하면 올바른 가격 책정 계층을 계획하고 선택하거나 가격 책정 계층을 변경하는 시기를 알 수 있습니다. 이를 결합하여 사용하는 방법을 이해하면 문제 발생 시 해당 문제를 찾아 해결할 수 있습니다.
참고 항목
QnA Maker 서비스가 2025년 3월 31일부로 종료됩니다. 이제 최신 버전의 질문 및 답변 기능이 Azure AI 언어의 일부로 사용할 수 있습니다. 언어 서비스 내의 질문 답변 기능은 질문 답변을 참조하세요. 2022년 10월 1일부터 새로운 QnA Maker 리소스를 만들 수 없습니다. 기존 QnA Maker 기술 자료를 질문 답변으로 마이그레이션하는 방법에 대한 정보는 마이그레이션 가이드를 참조하세요.
리소스 계획
QnA Maker 기술 자료를 처음 개발하는 경우 프로토타입 단계에서는 일반적으로 테스트와 프로덕션 모두에 적합한 단일 QnA Maker 리소스를 사용합니다.
프로젝트의 개발 단계로 이동하는 경우 다음 사항을 고려해야 합니다.
- 기술 자료 시스템에 포함될 언어의 수
- 사용 가능한 기술 자료가 필요한 지역의 수
- 시스템에 포함될 각 도메인의 문서 수
동일한 언어, 동일한 지역 및 동일한 주체 도메인이 결합된 모든 기술 자료를 단일 QnA Maker 리소스에 포함하려고 합니다.
가격 책정 계층 고려 사항
일반적으로 고려해야 하는 다음 세 가지 매개 변수가 있습니다.
서비스에서 필요한 처리량:
기술 자료의 크기 및 개수: 시나리오에 적합한 Azure Search SKU를 선택합니다. 일반적으로 다양한 주체 도메인의 수에 따라 필요한 기술 자료의 수를 결정합니다. 단일 언어에 대한 주체 도메인은 하나의 기술 자료에 있어야 합니다.
Azure Search Service 리소스는 2019년 1월 이후에 만들어졌어야 하며 체험(공유) 계층에 있을 수 없습니다. 고객 관리형 키는 Azure Portal에서 구성할 수 없습니다.
Important
특정 계층에 N-1개의 기술 자료를 게시할 수 있습니다. 여기서 N은 계층에서 허용되는 최대 인덱스 개수입니다. 또한 계층당 허용되는 문서의 최대 크기 및 개수를 확인합니다.
예를 들어 계층에 15개의 허용된 인덱스가 있는 경우 14개의 기술 자료를 게시할 수 있습니다(게시된 기술 자료당 하나의 인덱스). 15번째 인덱스는 모든 기술 자료에서 작성 및 테스트용으로 사용됩니다.
- 원본 문서 수: QnA Maker 관리 서비스의 체험 SKU는 포털 및 API를 통해 관리할 수 있는 문서 수를 3개(각각 1MB 크기)로 제한합니다. 표준 SKU는 관리할 수 있는 문서 수에 대한 제한이 없습니다. 자세한 내용은 여기를 참조하세요.
다음 표에서는 몇 가지 전반적인 지침을 제공합니다.
QnA Maker 관리 | App Service | Azure AI 검색 | 제한 사항 | |
---|---|---|---|---|
실험 | 체험 SKU | 무료 계층 | 무료 계층 | KB 최대 2개, 50MB 크기까지 게시 |
개발/테스트 환경 | 표준 SKU | 공유됨 | Basic | 최대 14KB, 2GB 크기까지 게시 |
프로덕션 환경 | 표준 SKU | Basic | Standard | KB 최대 49개, 25GB 크기까지 게시 |
권장 설정
대상 QPS | App Service | Azure AI 검색 |
---|---|---|
3 | S1, 복제본 1개 | S1, 복제본 1개 |
50 | S3, 10개 복제본 | S1, 12개 복제본 |
80 | S3, 10개 복제본 | S3, 12개 복제본 |
100 | P3V2, 10개 복제본 | S3, 12개 복제본, 3개 파티션 |
200~250 | P3V2, 20개 복제본 | S3, 12개 복제본, 3개 파티션 |
가격 책정 계층을 변경하는 경우
업그레이드 | 원인 |
---|---|
QnA Maker 관리 SKU 업그레이드 | 기술 자료에 더 많은 QnA 쌍 또는 문서 원본을 포함하려고 합니다. |
App Service SKU 업그레이드, Azure AI Search 계층 확인 및 Cognitive Search 복제본 만들기 | 기술 자료는 챗봇과 같은 클라이언트 앱의 더 많은 요청을 처리해야 합니다. |
Azure Search 서비스 업그레이드 | 많은 기술 자료를 포함하려고 합니다. |
Azure Portal에서 App Service를 업데이트하여 최신 런타임 업데이트를 가져옵니다.
QnA Maker의 키
QnA Maker 서비스는 App Service에서 호스팅되는 런타임에 사용되는 작성 키 및 쿼리 엔드포인트 키라는 두 가지 종류의 키를 처리합니다.
이러한 키는 API를 통해 서비스에 요청할 때 사용합니다.
속성 | 위치 | 목적 |
---|---|---|
작성/구독 키 | Azure Portal | 이러한 키는 QnA Maker 관리 서비스 API에 액세스하는 데 사용됩니다. 이러한 API를 사용하면 기술 자료의 질문과 대답을 편집하고 기술 자료를 게시할 수 있습니다. 이러한 키는 새 QnA Maker 서비스를 만들 때 만들어집니다. 키 및 엔드포인트 페이지의 Azure AI 서비스 리소스에서 이러한 키를 찾으세요. |
쿼리 엔드포인트 키 | QnA Maker 포털 | 이러한 키는 사용자 질문에 대한 응답을 가져오기 위해 게시된 기술 자료 엔드포인트를 쿼리하는 데 사용됩니다. 일반적으로 이 쿼리 엔드포인트는 챗봇 또는 QnA Maker 서비스에 연결되는 클라이언트 애플리케이션 코드에서 사용됩니다. 이러한 키는 QnA Maker 기술 자료를 게시할 때 만들어집니다. 이러한 키는 서비스 설정 페이지에서 찾습니다. 이 페이지는 페이지 오른쪽 위의 드롭다운 메뉴에 있는 사용자 메뉴에서 찾습니다. |
Azure Portal에서 작성 키 찾기
QnA Maker 리소스를 만든 Azure Portal에서 작성 키를 보고 다시 설정할 수 있습니다.
Azure portal의 QnA Maker 리소스로 이동하여 Azure AI 서비스 유형이 있는 리소스를 선택합니다.
키 및 엔드포인트로 이동합니다.
QnA Maker 포털에서 쿼리 엔드포인트 키 찾기
엔드포인트 키는 기술 자료로 호출하는 데 사용되므로 엔드포인트는 리소스와 동일한 지역에 있습니다.
엔드포인트 키는 QnA Maker 포털에서 관리할 수 있습니다.
QnA Maker 포털에 로그인하고, 프로필로 이동한 다음, 서비스 설정을 선택합니다.
키를 보거나 다시 설정합니다.
참고 항목
키가 손상된 것처럼 보이면 새로 고치세요. 클라이언트 애플리케이션 또는 봇 코드에 해당 변경 내용을 적용해야 할 수도 있습니다.
관리 서비스 지역
QnA Maker의 관리 서비스는 QnA Maker 포털 및 초기 데이터 처리에만 사용됩니다. 이 서비스는 미국 서부 지역에서만 사용할 수 있습니다. 이 미국 서부 서비스에는 고객 데이터가 저장되지 않습니다.
리소스 명명 고려 사항
QnA Maker 리소스의 리소스 이름(예: qna-westus-f0-b
)도 다른 리소스의 이름을 지정하는 데 사용됩니다.
Azure Portal 만들기 창에서 QnA Maker 리소스를 만들고, 다른 리소스에 대한 가격 책정 계층을 선택할 수 있습니다.
리소스가 만들어지면 문자를 이름에 추가하는 선택적 Application Insights 리소스를 제외하고는 동일한 이름을 갖습니다.
팁
QnA Maker 리소스를 만들 때 새 리소스 그룹을 만듭니다. 이렇게 하면 리소스 그룹별로 검색할 때 QnA Maker 리소스와 연결된 모든 리소스를 볼 수 있습니다.
팁
명명 규칙을 사용하여 리소스 또는 리소스 그룹의 이름 내에서 가격 책정 계층을 나타냅니다. 새 기술 자료를 만들거나 새 문서를 추가할 때 오류가 발생하는 경우 일반적으로 Cognitive Search 가격 책정 계층 제한 문제입니다.
리소스 용도
QnA Maker를 사용하여 만든 각 Azure 리소스에는 특정 용도가 있습니다.
- QnA Maker 리소스
- Cognitive Search 리소스
- App Service
- App Service 요금제
- Application Insights 서비스
QnA Maker 리소스
QnA Maker 리소스는 저작 및 게시 API에 대한 액세스를 제공합니다.
QnA Maker 리소스 구성 설정
QnA Maker 포털에서 새 기술 자료를 만드는 경우 언어 설정은 리소스 수준에서 적용되는 유일한 설정입니다. 리소스에 대한 첫 번째 기술 자료를 만들 때 언어를 선택합니다.
Cognitive Search 리소스
Cognitive Search 리소스는 다음 용도로 사용됩니다.
- QnA 쌍 저장
- 런타임에 QnA 쌍의 초기 순위(#1 순위 매기기) 제공
인덱스 사용
리소스는 테스트 인덱스 역할을 하는 하나의 인덱스를 유지하고, 나머지 인덱스는 각각 게시되는 하나의 기술 자료와 상관 관계가 있습니다.
15개의 인덱스를 포함하도록 가격이 책정된 리소스는 14개의 게시되는 기술 자료를 포함하며, 하나의 인덱스는 모든 기술 자료를 테스트하는 데 사용됩니다. 대화형 테스트 창을 사용하는 쿼리에서 테스트 인덱스를 사용하지만 특정 기술 자료와 연결된 특정 파티션의 결과만 반환하도록 이 테스트 인덱스는 기술 자료별로 분할되어 있습니다.
언어 사용
QnA Maker 리소스에서 만든 첫 번째 기술 자료는 Cognitive Search 리소스 및 모든 인덱스에 대한 단일 언어 세트를 결정하는 데 사용됩니다. QnA Maker 서비스에 대해 하나의 언어 세트만 설정할 수 있습니다.
단일 Cognitive Search 서비스 사용
포털을 통해 QnA 서비스 및 해당 종속성(예: Search)을 만드는 경우 Search Service가 만들어지고 QnA Maker 서비스에 연결됩니다. 이러한 리소스가 만들어지면 이전에 기존 Search Service를 사용하고 방금 만든 서비스를 제거하도록 App Service 설정을 업데이트할 수 있습니다.
QnA Maker 리소스 생성 프로세스의 일부로 생성된 리소스와 다른 Azure AI 서비스 리소스를 사용하도록 QnA Maker를 구성하는 방법을 알아보세요.
App Service 및 App Service 요금제
App Service는 클라이언트 애플리케이션에서 런타임 엔드포인트를 통해 게시된 기술 자료에 액세스하는 데 사용됩니다. 앱 서비스에는 런타임 시 QnA 쌍의 NLP(자연어 처리) 기반 두 번째 순위 계층(순위 #2)이 포함됩니다. 2번째 순위는 메타데이터 및 추가 작업 프롬프트를 포함할 수 있는 인텔리전트 필터를 적용합니다.
게시된 기술 자료를 쿼리하려면 게시된 모든 기술 자료에서 동일한 URL 엔드포인트를 사용하고 기술 자료 ID를 경로 내에 지정합니다.
{RuntimeEndpoint}/qnamaker/knowledgebases/{kbId}/generateAnswer
Application Insights
Application Insights는 채팅 로그 및 원격 분석을 수집하는 데 사용됩니다. 서비스에 대한 자세한 내용은 일반적인 Kusto 쿼리를 검토하세요.
QnA Maker와 서비스 공유
QnA Maker는 여러 Azure 리소스를 만듭니다. 관리를 줄이고 비용 공유를 활용하려면 다음 표를 사용하여 공유할 수 있거나 공유할 수 없는 리소스를 파악합니다.
서비스 | 공유 | 원인 |
---|---|---|
Azure AI 서비스 | X | 디자인상 불가능 |
App Service 계획 | ✔ | App Service 요금제에 할당된 고정 디스크 공간입니다. 동일한 App Service 요금제를 공유하는 다른 앱에서 상당한 디스크 공간을 사용하는 경우 QnAMaker App Service 인스턴스에 문제가 발생합니다. |
App Service | X | 디자인상 불가능 |
Application Insights | ✔ | 공유할 수 있습니다. |
Search Service | ✔ | 1. testkb 는 QnAMaker 서비스의 예약된 이름입니다. 다른 사용자가 사용할 수 없습니다.2. 이름이 synonym-map 인 동의어 맵은 QnAMaker 서비스에 예약되어 있습니다.3. 게시된 기술 자료의 수는 Search Service 계층으로 제한됩니다. 사용 가능한 무료 인덱스가 있는 경우 다른 서비스에서 이 인덱스를 사용할 수 있습니다. |
다음 단계
- QnA Maker 기술 자료에 대해 알아보기
- 기술 자료 수명 주기 이해
- 서비스 및 기술 자료 제한 검토