다음을 통해 공유


대화에서 PII(개인 식별 정보) 검색 및 수정 방법

대화형 PII 기능은 대화를 평가하여 미리 정의된 여러 범주의 콘텐츠에서 중요한 정보(PII)를 추출하고 수정할 수 있습니다. 이 API는 전사된 텍스트(음성 텍스트로 참조됨)와 채팅 모두에서 작동합니다. 음성 텍스트의 경우 API를 사용하면 오디오 세그먼트를 편집할 수도 있습니다. 이 편집에는 해당 오디오 세그먼트에 대한 오디오 타이밍 정보를 제공하여 PII 정보가 포함됩니다.

데이터 처리 방법 결정(선택 사항)

PII 검색 모델 지정

기본적으로 이 기능은 입력에서 사용 가능한 최신 AI 모델을 사용합니다. 특정 모델 버전을 사용하도록 API 요청을 구성할 수도 있습니다.

언어 지원

자세한 내용은 PII 언어 지원 페이지를 참조하세요. 현재 대화형 PII GA 모델은 영어만 지원합니다. 미리 보기 모델 및 API는 다른 언어 서비스와 동일한 목록 언어를 지원합니다.

지역 지원

대화형 PII API는 언어 서비스에서 지원하는 모든 Azure 지역을 지원합니다.

데이터 제출

참고 항목

Language Studio를 사용하여 제출할 대화 텍스트 서식에 대한 자세한 내용은 Language Studio 문서를 참조하세요.

API에 입력을 대화 항목 목록으로 제출할 수 있습니다. 요청을 받으면 분석이 수행됩니다. API는 비동기이므로 API 요청을 보내고 결과를 받는 사이에 지연이 있을 수 있습니다. 분당 및 초당 보낼 수 있는 요청의 크기와 수에 대한 정보는 아래 데이터 제한을 참조하세요.

비동기 기능을 사용하는 경우 요청이 수집된 시간부터 24시간 동안 API 결과를 사용할 수 있으며 응답에 표시됩니다. 이 기간이 지나면 결과가 제거되고 더 이상 검색할 수 없습니다.

대화형 PII에 데이터를 제출하면 요청당 하나의 대화(채팅 또는 음성)를 보낼 수 있습니다.

API는 지정된 대화 입력에 대해 정의된 모든 엔터티 범주 를 검색하려고 시도합니다. 검색되고 반환되는 엔터티를 지정하려면 적절한 엔터티 범주와 함께 선택적 piiCategories 매개 변수를 사용합니다.

음성 대화 내용의 경우 검색된 엔터티는 제공된 매개 변수 값에 redactionSource 반환됩니다. 현재 redactionSource에 대해 지원되는 값은 text, lexical, itnmaskedItn입니다(각각 음성 텍스트 변환 REST API의 display\displayText, lexical, itnmaskedItn 형식에 매핑). 또한 음성 대본 입력의 경우 이 API는 오디오 편집 기능을 강화하기 위한 오디오 타이밍 정보도 제공합니다. audioRedaction 기능을 사용하려면 true 값과 함께 선택적 includeAudioRedaction 플래그를 사용합니다. 오디오 편집은 어휘 입력 형식에 따라 수행됩니다.

참고 항목

대화 PII는 이제 문서 크기로 40,000자를 지원합니다.

PII 결과 가져오기

PII 검색에서 결과를 얻은 경우 결과를 애플리케이션으로 스트리밍하거나 출력을 로컬 시스템의 파일에 저장할 수 있습니다. API 응답에는 해당 범주 및 하위 범주 및 신뢰도 점수를 포함하여 인식된 엔터티가 포함됩니다. PII 엔터티가 수정된 텍스트 문자열도 반환됩니다.

예제

  1. Azure Portal에서 스토리지 계정 개요 페이지로 이동합니다.

  2. 왼쪽 메뉴에서 키 및 엔드포인트를 선택합니다. API 요청을 인증하려면 키와 엔드포인트 중 하나가 필요합니다.

  3. 선택한 언어에 대한 클라이언트 라이브러리 패키지를 다운로드하여 설치합니다.

    언어 패키지 버전
    .NET 1.0.0
    Python 1.0.0
  4. 클라이언트 및 반환 개체에 대한 자세한 내용은 다음 참조 문서를 참조하세요.

서비스 및 데이터 제한

분당 및 초당 보낼 수 있는 요청의 크기와 수에 대한 내용은 서비스 제한 문서를 참조하세요.