다음을 통해 공유


Content Understanding 오디오 솔루션(미리 보기)

Important

  • Azure AI Content Understanding은 미리 보기로 제공됩니다. 공개 미리 보기 릴리스는 활성 개발 중인 기능에 대한 초기 액세스를 제공합니다.
  • 기능, 접근 방식 및 프로세스는 GA(일반 공급) 전에 기능이 변경되거나 제한될 수 있습니다.
  • 자세한 내용은 Microsoft Azure 미리 보기에 대한 추가 사용 약관을 참조하세요.

Content Understanding 오디오 분석기를 사용하면 대화형 오디오의 전사 및 일기를 사용하여 요약, 감정 및 주요 항목과 같은 구조화된 필드를 추출할 수 있습니다. Azure AI Foundry 포털을 사용하여 비즈니스 요구 사항에 맞게 오디오 분석기 템플릿을 사용자 지정하여 결과 생성을 시작합니다.

다음은 대화형 오디오 데이터와 함께 Content Understanding을 사용하는 일반적인 시나리오입니다.

  • 요약 및 감정 분석을 통해 고객 인사이트를 얻습니다.
  • 콜 센터에서 통화 품질 및 규정 준수를 평가하고 확인합니다.
  • 팟캐스트 게시를 위한 자동화된 요약 및 메타데이터를 만듭니다.

오디오 분석기 기능

Content Understanding 오디오 워크플로의 그림입니다.

Content Understanding은 미디어 자산 관리 솔루션의 초석 역할을 하며 오디오 파일에 대해 다음 기능을 사용할 수 있습니다.

콘텐츠 추출

  • 전사. 대화형 오디오를 WebVTT 형식의 검색 가능하고 분석 가능한 텍스트 기반 대본으로 변환합니다. 기록 데이터에서 사용자 지정 가능한 필드를 생성할 수 있습니다. 요청 시 문장 수준 및 단어 수준 타임스탬프를 사용할 수 있습니다.

  • Diarization. 대화의 화자를 구분하여 대본의 일부를 특정 화자의 특성으로 지정합니다.

  • 화자 역할 검색. 연락처 센터 통화 데이터 내에서 에이전트 및 고객 역할을 식별합니다.

  • 언어 감지. 오디오에서 언어를 자동으로 검색하거나 지정된 언어/로캘 힌트를 사용합니다.

필드 추출

필드 추출을 사용하면 통화 로그에서 요약, 감정 및 언급된 엔터티와 같은 오디오 파일에서 구조화된 데이터를 추출할 수 있습니다. 먼저 제안된 분석기 템플릿을 사용자 지정하거나 처음부터 만들 수 있습니다.

주요 이점

Content Understanding은 다음을 비롯한 고급 오디오 기능을 제공합니다.

  • 사용자 지정 가능한 데이터 추출 필드 스키마를 수정하여 정확한 데이터 생성 및 추출을 허용하여 특정 요구 사항에 맞게 출력을 조정합니다.

  • 생성 모델. 생성 AI 모델을 활용하여 추출하려는 콘텐츠를 자연어로 지정하고 서비스에서 원하는 출력을 생성합니다.

  • 통합 전처리. 전사, 일지화 및 역할 검색과 같은 기본 제공 전처리 단계를 통해 생성 모델에 풍부한 컨텍스트를 제공합니다.

  • 시나리오 적응성. 사용자 지정 필드를 생성하여 요구 사항에 맞게 서비스를 조정하고 관련 데이터를 추출합니다.

Content Understanding 오디오 분석기 템플릿

Content Understanding은 사용자 지정 가능한 오디오 분석기 템플릿을 제공합니다.

  • 통화 후 분석. 통화 기록을 분석하여 대화 내용, 통화 요약, 감정 평가 등을 생성합니다.

  • 대화 분석. 대화 오디오 녹음에서 전사, 요약 및 감정 평가를 생성합니다.

템플릿으로 시작하거나 특정 비즈니스 요구 사항에 맞게 사용자 지정 분석기를 만듭니다.

입력 요구 사항

지원되는 오디오 형식의 자세한 목록은 서비스 제한 및 코덱 페이지를 참조하세요.

지원되는 언어 및 지역

지원되는 지역, 언어 및 로캘의 전체 목록은 언어 및 지역 지원) 페이지를 참조하세요.

데이터 개인 정보 보호 및 보안

Content Understanding을 사용하는 개발자는 고객 데이터에 대한 Microsoft의 정책을 검토해야 합니다. 자세한 내용은 데이터, 보호 및 개인 정보 페이지를 참조하세요.

다음 단계