Compartilhar via


Compreendendo codecs de áudio da Unificação de Mensagens

Aplica-se a: Exchange Server 2010

Tópico modificado em: 2009-10-10

Na UM (Unificação de Mensagens) do Microsoft Exchange Server 2010, um codec é usado para armazenar mensagens de caixa postal. Outro codec é usado entre um gateway de IP ou PBX (Private Branch eXchange) e o servidor de Unificação de Mensagens (UM). Exchange 2010 UM pode usar qualquer um dos três seguintes codecs de áudio para criar e armazenar mensagens de caixa postal:

  • Windows Media Audio (WMA)
  • Group System Mobile (GSM) 06.10
  • G.711 Pulse Code Modulation (PCM) Linear

No entanto, os codecs G.711 (PCMA e PCMU) e G.723.1 são codecs VoIP usados entre um gateway IP e o servidor de Unificação de Mensagens.

Parte do planejamento do sistema de Unificação de Mensagens envolve a seleção do codec de áudio correto com base nas necessidades e nos requisitos de sua organização. Este tópico aborda os codecs de áudio que a Unificação de Mensagens pode usar e o ajudará a planejar a implantação de UM.

Codecs

Dois tipos de codec são usados na Unificação de Mensagens: o codec que é usado entre gateways IP e o servidor de Unificação de Mensagens ou entre gateways PBX e IP, dependendo do tipo de PBX e do codec usado para codificar e armazenar mensagens de voz para os usuários.

O termo codec é uma combinação das palavras "codificação" e "decodificação" e é usado com dados de áudio digitais. Um codec é um programa de software que transforma dados digitais em formato de arquivo de áudio ou formato de streaming de áudio. Codecs são usados para converter um sinal de voz analógico em uma versão digital do sinal de voz. Os codecs podem variar em questões como qualidade do som, largura de banda necessária para usá-los e requisitos de sistema necessários para a codificação.

Quando você usa um telefone comum por PSTN (Rede Telefônica de Comutação Pública), sua voz é transportada em um formato analógico através da linha telefônica. Mas com VoIP, sua voz é convertida em sinais digitais. Esse processo de conversão é conhecido como codificação. A codificação é realizada por um codec. Depois que a voz digitalizada alcançar seu destino, ela deverá ser decodificada de volta ao seu formato analógico original para que a pessoa na outra extremidade da chamada possa ouvir e compreender o chamador.

Codec VoIP

Em UM, três tipos de codecs podem ser usados entre gateways de IP ou IP PBXs e o servidor de UM. Os servidores de Unificação de Mensagens podem aceitar os seguintes codecs VoIP de um gateway IP ou IP PBX:

  • G.711 µ-law
  • G.711 A-law
  • G.723.1

G.711 é um padrão que foi desenvolvido para uso com codecs de áudio. Há dois algoritmos principais definidos no padrão para G.711: o algoritmo µ-law, usado na América do Norte e no Japão, e o algoritmo A-law, usado na Europa e em outros países. O codec de áudio G.723.1 é mais usado em aplicativos VoIP e exige uma licença para ser usado. G.723.1 é um tipo de codec de alta qualidade e alta compactação.

Tanto um servidor de Unificação de Mensagens como um gateway IP ou IP PBX aceito podem oferecer os codecs G.711 e G.723.1. No entanto, o servidor de Unificação de Mensagens escolherá seu codec preferencial com base na chave WireCodecList do Registro. Por padrão, o primeiro codec a ser usado é G.723.1. Se você quiser usar um codec diferente de G.723.1 entre o servidor de Unificação de Mensagens e o gateway IP ou IP PBX, recomendamos que você altere a configuração no gateway IP ou IP PBX e não adicione, remova ou altere nenhum valor da chave WireCodecList do Registro. O servidor de Unificação de Mensagens determinará o codec que está sendo usado pelo gateway IP ou IP PBX e selecionará o codec apropriado da lista no Registro.

A tabela a seguir resume alguns codecs VoIP comuns.

Codecs VoIP

Codec VoIP Largura de banda (Kbps) Descrição

G.711

64

Este codec exige pouco processamento. Ele precisa de pelo menos 128 kbps (quilobits por segundo) para comunicação bidirecional.

G.723.1

5.3/6.3

Este codec oferece alta compactação com áudio de alta qualidade. Ele exige mais processamento do que o codec G.711. O codec G.723.1 usa largura de banda reduzida, mas oferece áudio de qualidade inferior.

Retornar ao início

Codec de armazenamento de mensagens de voz do UM

Os planos de discagem de UM são essenciais para o funcionamento da Unificação de Mensagens. Por padrão, quando você cria um plano de discagem de UM, ele usa o codec de áudio WMA. Entretanto, depois de criar um plano de discagem de UM, você pode configurá-lo para usar codecs de áudio GSM 06.10 ou G.711 PCM Linear.

Cada codec de áudio apresenta vantagens e desvantagens. O codec de áudio WMA foi selecionado como padrão por suas propriedades de qualidade de som e compactação. Os codecs de áudio GSM 06.10 e G.711 PCM Linear foram incluídos como opções disponíveis por causa de sua capacidade de oferecer suporte a outros tipos de sistemas de mensagens.

Ao planejar a Unificação de Mensagens, você deve equilibrar o tamanho e a qualidade relativa do arquivo de áudio que será criado para as mensagens de voz. Em geral, quanto mais alta a taxa de bits de um arquivo de áudio, melhor será a qualidade. Você deve considerar também se o arquivo de áudio está compactado. A taxa de bits de amostra (bits/s) e as propriedades de compactação de cada codec de áudio usado em Unificação de Mensagens são as seguintes:

Codecs de armazenamento de mensagens de voz de UM padrão

Codec de armazenamento de mensagens de voz Bits Arquivo compactado?

WMA

16 bits

Sim

G.711 PCM

16 bits

Não

GSM 06.10

8 bits

Sim

Na Unificação de Mensagens, os codecs de áudio WMA, G.711 PCM Linear e GSM 06.10 são usados para criar arquivos de áudio .wma e .wav para mensagens de voz. Entretanto, o tipo de arquivo criado depende do codec de áudio usado para criar o arquivo de áudio da mensagem de voz. Na Unificação de Mensagens, o codec de áudio .wma cria arquivos de áudio .wma e os codecs de áudio GSM 06.10 e G.711 PCM Linear produzem arquivos de áudio .wav. Os dois tipos de arquivos de áudio são enviados juntos com a mensagem de email para o destinatário da mensagem de voz.

Normalmente, mas não sempre, a codificação e a decodificação dos dados digitais também envolve compactação ou descompactação. A compactação de áudio é uma forma de compactação de dados que reduz o tamanho dos arquivos de dados de áudio. O algoritmo de compactação de áudio usado pelo codec de áudio compacta os arquivos de áudio .wma ou .wav. Na Unificação de Mensagens, o tipo de algoritmo de compactação de áudio usado é baseado no tipo de codec de áudio selecionado nas propriedades do plano de discagem de UM. Depois que o arquivo de áudio é criado e compactado, ele é anexado à mensagem de voz.

Algumas vezes, as informações dos dados digitais são perdidas durante a compactação e descompactação. Quanto maior a compactação usada para compactar o arquivo de áudio, maior será a perda de informações durante a conversão. No entanto, será usado menos espaço em disco porque o tamanho do arquivo de áudio será reduzido. Por outro lado, quanto menor a compactação, menor a perda de informações. No entanto, será usado mais espaço em disco devido ao aumento de tamanho de cada arquivo de áudio.

Banda larga RTAudio ou áudio de alta fidelidade para gravar mensagens de voz está também disponível como um codec de áudio. No entanto, o áudio de alta fidelidade com o uso de RTAudio só fica disponível depois da integração bem-sucedida da Unificação de Mensagens do Exchange 2007 com o Office Communications Server 2007. Para habilitar RTAudio, o plano de discagem do UM deve ser configurado como um plano de discagem do tipo URI do protocolo SIP, e o codec de atendimento de chamadas no plano de discagem deve ser configurado para WMA.

Importante

O RTAudio não está disponível em ambientes onde o Office Communications Server 2007 não está implantado. Isso ocorre porque, nesses ambientes, o plano de discagem está configurado para Ramal e não URI do SIP.

Há dois fluxos de mídia para cada chamada de entrada: entrada para um servidor de Unificação de Mensagens e saída de um servidor de Unificação de Mensagens. Quando o tipo de plano de discagem está configurado para URI do SIP e o codec de atendimento de chamadas no plano de discagem está configurado para WMA, um servidor de Unificação de Mensagens tenta selecionar o codec VoIP RTAudio para o fluxo de mídia de entrada. Se a negociação for bem-sucedida, o codec RTAudio do fluxo de entrada será usado para chamadas de atendimento de chamadas ou chamadas originadas do Office Communicator 2007.

Dica

Chamadas realizadas usando o recurso Tocar no Telefone não usarão o codec RTAudio. O fluxo de entrada de chamadas realizadas usando o recurso Tocar no Telefone usará o codec G.711 ou G.723.1.

Quando o codec RTAudio é usado, a mensagem de voz será gravada em alta fidelidade e armazenada como um arquivo de áudio com extensão .wma. Quando a mensagem de voz for reproduzida para o usuário no Office Outlook 2007 ou Outlook Web Access, ele irá ouvi-la em áudio de alta fidelidade. Se a negociação for malsucedida, o codec G.711 ou G.723.1 será usado. Os codecs G.711 e G.723.1 são codecs de banda estreita. Quando eles são usados como o codec VoIP, a mensagem de voz é gravada e armazenada como um arquivo de áudio de banda estreita com extensão .wma.

O fluxo de mídia de saída sempre será negociado usando o codec G.711 ou G.723.1. Isso significa que os chamadores sempre ouvirão áudio de banda estreita pelo telefone. Isso também se aplica a situações em que a chamada é realizada usando o Office Communicator.

O processamento de RTAudio por um servidor de Unificação de Mensagens consome mais ciclos de CPU que qualquer um dos codecs G.711 ou G.723.1. Se a integração do Office Communications Server 2007 tiver sido bem-sucedida, mas você quiser desativar o RTAudio para reduzir o número de ciclos de CPU usados, será possível:

  • Definir o codec de atendimento de chamadas ou de armazenamento do plano de discagem como GSM ou PCM.

  • Desabilitar a configuração no Registro. A chave de Registro é: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Speech Server\2.0\WireCodecList. Para desabilitar o RTAudio, remova RTAudio16KHz e RTAudio8KHz da lista de codecs na chave de Registro.

    Importante

    Não há suporte para qualquer outra adição, modificação ou exclusão em outros valores ou chaves na chave WireCodecList.

Dica

A edição incorreta do Registro pode causar problemas graves que podem exigir a reinstalação do sistema operacional. Talvez não seja possível resolver os problemas resultantes da edição incorreta do Registro. Antes de editar o Registro, faça backup de todos os dados importantes.

Retornar ao início

Dimensionamento da mensagem do UM

Você pode configurar a UM para usar um destes três codecs de áudio para criar mensagens de voz: WMA, GSM 06.10 e G.711 PCM Linear. O codec de áudio WMA é sempre armazenado no formato Windows Media, e o anexo é um arquivo que tem uma extensão de nome de arquivo .wma. Arquivos de áudio codificados com o codec de áudio GSM ou G.711 PCM Linear são sempre armazenados em formato RIFF/WAV, e o anexo é um arquivo que tem uma extensão de nome de arquivo .wav.

O tamanho de mensagens de voz de Unificação de Mensagens depende do tamanho do anexo que contém os dados de voz. Por sua vez, o tamanho do anexo depende dos seguintes fatores:

  • A duração da gravação da mensagem de voz
  • O codec de áudio usado
  • O formato de armazenamento do arquivo de áudio

A figura a seguir mostra como o tamanho do arquivo de áudio depende da duração da gravação da mensagem de voz para os três codecs de áudio que você pode usar na UM.

Dica

Nesta figura, a duração média de uma mensagem de voz de atendimento de chamadas é de aproximadamente 30 segundos.

Tamanho do arquivo de áudio
UM_Message_Sizing

WMA

WMA é o codec de áudio com maior taxa de compactação dos três tipos de codec. A compactação é de aproximadamente 11.000 bytes para cada 10 segundos de áudio. Entretanto, o formato do arquivo .wma tem uma seção de cabeçalho muito maior do que o formato de arquivo .wav. A seção de cabeçalho do arquivo .wma é de aproximadamente 7 quilobytes (KB), embora a seção de cabeçalho do arquivo .wav seja de menos de 100 bytes. Embora as gravações de áudio WMA sejam gravadas por mais de 15 segundos, ficam menores do que as gravações de áudio GSM. Portanto, para os arquivos de áudio menores, mas com melhor qualidade, use o codec de áudio WMA.

G.711 PCM Linear

O codec de áudio G.711 PCM Linear cria arquivos de áudio .wav que não são compactados. Por essa razão, os arquivos de áudio .wav do G.711 PCM Linear ocupam mais espaço, seja qual for a duração, quando comparados com os codecs de áudio GSM e WMA. Arquivos de áudio G.711 PCM Linear .wav ocupam um pouco mais de 160.000 bytes para cada 10 segundos de áudio. Arquivos de áudio G.711 PCM Linear .wav têm a melhor qualidade de áudio dos três codecs de áudio usados pela Unificação de Mensagens. Entretanto, a qualidade de arquivos de áudio comparáveis criados com os codecs de áudio WMA e GSM são aceitáveis para a maioria dos usuários que ouvem mensagens de voz.

GSM

O codec de áudio GSM cria arquivos de áudio .wav que são compactados. Arquivos de áudio GSM .wav ocupam um pouco mais de 16.000 bytes para cada 10 segundos de áudio. Entretanto, GSM cria um arquivo de áudio maior do que o arquivo de áudio criado pelo codec de áudio WMA. Por essa razão, ao considerar a qualidade da mensagem de voz e o tamanho, talvez essa não seja a melhor opção.

Retornar ao início