다음을 통해 공유


Windows Media 오디오 음성 코덱 사용

Windows Media 오디오 음성 코덱은 음성을 포함하는 오디오에 최적화된 낮은 비트 전송률 압축을 제공합니다. 이러한 작은 샘플을 생성하는 코덱의 능력은 인간의 목소리의 소리의 제한된 주파수 범위 때문입니다. 이 최적화는 전용 음성 인코더가 음악과 같은 더 복잡한 소리를 포함하는 콘텐츠에 대해 품질이 낮은 출력을 생성한다는 것을 의미합니다. 그러나 Windows Media Audio Voice 코덱은 음성, 음악 및 혼합 콘텐츠에 대해 별도의 모드를 제공하여 이러한 잠재적 품질 문제를 보완합니다. 코덱은 혼합 콘텐츠를 분석하여 파일의 각 부분에 사용할 모드를 결정합니다.

Windows Media Audio Voice 코덱은 클래스 식별자 CLSID_CWMSPEncMediaObject2 식별된 인코더 개체와 클래스 식별자 CLSID_CWMSPDecMediaObject 식별된 디코더 개체에서 구현됩니다. 이 코덱을 사용하는 미디어 형식의 형식 태그는 0x00A.

인코더 구성

음성 인코더는 음성, 음악 및 혼합의 세 가지 모드를 지원합니다. 각 모드는 해당 유형의 콘텐츠에 대한 최상의 결과를 얻기 위해 최적화됩니다. IPropertyStore의 메서드를 사용하여 MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode 속성을 설정하여 음성 인코더 모드를 구성할 수 있습니다.

혼합 콘텐츠에 대해 구성된 경우 Windows Media Audio Voice 코덱은 콘텐츠의 음악 구절을 자동으로 검색합니다. 결과에 만족하지 않는 경우 편집 의사 결정 목록(EDL)을 사용하여 콘텐츠의 음악 위치를 지정할 수 있습니다. 자세한 내용은 인코딩 음성에 편집 의사 결정 목록 사용을 참조하세요.

다른 오디오 인코더와 달리 MFPKEY_WMAVOICE_ENC_BufferWindow 속성을 사용하여 음성 콘텐츠의 버퍼 창 값을 설정할 수 있습니다. 그러나 대부분의 경우 기본값이 제대로 작동해야 합니다.

참고

   음성 인코더를 구성할 때 입력 형식을 설정하기 전에 출력 형식을 설정하는 것이 매우 중요합니다. 이는 모든 오디오 코덱에 권장되는 작업 순서이지만 IMediaObject::GetOutputType 또는 IMFTransform::GetOutputType을 호출할 때 입력이 설정된 경우 음성 인코더는 잘못된 출력 형식을 보고할 수 있습니다.

 

디코딩

음성 오디오를 디코딩하기 위한 특별한 요구 사항은 없습니다. 자세한 내용은 오디오 디코딩 구성을 참조하세요.

오디오 작업