Использование голосового кодека Windows Media Audio

Статья
03/21/2025

Кодек голосовой связи Windows Media обеспечивает сжатие с низкой скоростью, оптимизированное для звука, содержащего речь. Способность кодека производить такие небольшие образцы обусловлена ограниченным диапазоном частот звуков человеческого голоса. Эта оптимизация означает, что выделенный кодировщик голосовых данных создает низкокачественные выходные данные для содержимого, содержащего более сложные звуки, такие как музыка. Однако кодек голосовой связи Windows Media компенсирует эту потенциальную проблему качества, предоставляя отдельные режимы для голосового, музыкального и смешанного содержимого. Кодек анализирует смешанное содержимое, чтобы определить, какой режим следует использовать для каждой части файла.

Кодек голосовой связи Windows Media реализуется в объекте кодировщика, определяемом идентификатором класса CLSID_CWMSPEncMediaObject2, и в объекте декодера, определяемом идентификатором класса CLSID_CWMSPDecMediaObject. Тег формата типов мультимедиа при использовании этого кодека — 0x00A.

Настройка кодировщика

Кодировщик голоса поддерживает три режима: речь, музыка и смешанные. Каждый режим оптимизирован для получения наилучших результатов для этого типа контента. Режим голосового кодировщика можно настроить с помощью методов IPropertyStore, чтобы задать свойство MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode.

При настройке смешанного содержимого кодек голосовой связи Windows Media автоматически обнаруживает фрагменты музыки в содержимом. Если вы не удовлетворены результатами, можно указать расположение музыки в содержимом с помощью списка решений редактирования (EDL). Дополнительные сведения см. в разделе «Использование списка решений для кодирования голоса».

В отличие от других кодировщиков звука, можно задать значение буферного окна для голосового содержимого с помощью свойства MFPKEY_WMAVOICE_ENC_BufferWindow. Однако значения по умолчанию должны работать нормально в большинстве случаев.

Заметка

При настройке голосового кодировщика очень важно задать тип вывода перед настройкой входного типа. Это рекомендуемый порядок операций для всех звуковых кодеков, но кодировщик голосовых данных может сообщать об ошибочных типах выходных данных, если входные данные заданы при вызове IMediaObject::GetOutputType или IMFTransform::GetOutputType.

Расшифровка

Для декодирования голосового звука нет особых требований. Дополнительные сведения см. в разделе Настройка декодирования звука.

Работа с аудио

Поделиться через

Использование голосового кодека Windows Media Audio

Настройка кодировщика

Расшифровка

Обратная связь

Дополнительные ресурсы

Поделиться через

Использование голосового кодека Windows Media Audio

Настройка кодировщика

Расшифровка

Связанные разделы

Обратная связь

Дополнительные ресурсы