Gerenciamento de capacidade e disponibilidade no Lync Server 2013
Tópico última modificação: 18-08-2014
A finalidade do gerenciamento de capacidade e do gerenciamento de disponibilidade é medir e controlar o desempenho do sistema. Recomendamos que você implemente procedimentos de gerenciamento de capacidade e gerenciamento de disponibilidade para poder medir e controlar o desempenho do sistema. Você precisa saber se o sistema está disponível e se ele pode lidar com as demandas atuais e projetar definindo linhas de base e monitorando o sistema para procurar tendências.
Gerenciamento de capacidade
O gerenciamento de capacidade envolve planejamento, dimensionamento e controle da capacidade do serviço para ajudar a garantir que os níveis mínimos de desempenho especificados em seu SLA sejam excedidos. Um bom gerenciamento de capacidade ajuda a garantir que você possa fornecer serviços de TI a um custo razoável e ainda atender aos níveis de desempenho definidos em seus SLAs com o cliente. Esses critérios podem incluir o seguinte:
Tempo de Resposta do Sistema Esse é o tempo medido que o sistema leva para executar ações típicas. Os exemplos incluem o tempo necessário para que a função de servidor de áudio/vídeo processe o tráfego de áudio/vídeo, o tempo necessário para um cliente criar e ingressar em uma conferência ou o tempo necessário para que a presença seja atualizada em todos os clientes do inspetor.
Capacidade de armazenamento Essa é a capacidade de um sistema de armazenamento, seja um banco de dados de conteúdo, um dispositivo de backup ou uma unidade local. Os exemplos incluem a quantidade máxima de espaço de armazenamento a ser fornecida por site e o tempo em que os backups devem ser armazenados antes de serem substituídos.
O ajuste da capacidade é frequentemente um caso de garantir que recursos físicos suficientes estejam disponíveis, como espaço em disco e largura de banda de rede. A tabela a seguir lista resoluções típicas para problemas relacionados à capacidade.
Resoluções típicas para problemas relacionados à capacidade
Problema | Possível resolução |
---|---|
Usuários remotos com desempenho ruim de áudio/vídeo |
Verifique se a largura de banda apropriada está disponível nos links wan e se a QoS está habilitada e configurada adequadamente. Verifique os dados de QoE. |
A resposta geral do ambiente do Lync é lenta. |
Execute testes para verificar se os servidores front-end existentes podem lidar com a carga. Introduza um novo servidor front-end, se necessário. Verifique os tempos de resposta do banco de dados SQL e corrija as causas dos atrasos (por exemplo, melhorar a E/S do disco). |
A solução de problemas com mais detalhes é abordada no Guia de Rede do Lync Server.
A capacidade é afetada pela configuração do sistema e depende de recursos físicos, como largura de banda de rede. Por exemplo, se um ambiente do Lync estiver configurado para executar um backup completo à noite, tenha cuidado para ajudar a garantir que o efeito no desempenho interativo experimentado pelos usuários finais seja minimizado.
O gerenciamento de capacidade é o processo de manter a capacidade de um sistema em níveis aceitáveis e resolver os seguintes problemas:
Reagindo a alterações nos requisitos Os requisitos de capacidade precisam ser ajustados para contabilitar as alterações no sistema ou na organização. Por exemplo, se seu ambiente decidir implementar Enterprise Voice, o número e o posicionamento dos Servidores de Mediação e gateways PSTN (rede telefônica pública comunada) serão muito importantes. Se você estiver fazendo tronco SIP (Protocolo de Iniciação de Sessão) ou SIP direto, o design geral será alterado significativamente para fornecer o melhor Enterprise Voice desempenho.
Prevendo requisitos futuros Alguns requisitos de capacidade mudam de forma previsível ao longo do tempo. Acompanhando tendências, você pode planejar atualizações com antecedência. Por exemplo, a largura de banda disponível entre vários sites do Lync deve ser monitorada para criar uma linha de base. Essa linha de base permitirá prever quando você precisa adicionar mais largura de banda a esses links à medida que a contagem de usuários nesses sites remotos aumenta com o tempo.
Gerenciamento de disponibilidade
O gerenciamento de disponibilidade é o processo de garantir que qualquer serviço de TI forneça de forma consistente e econômica o nível de serviço consistente e confiável exigido pelo cliente. O gerenciamento de disponibilidade lida com a minimização da perda de serviço e com a certeza de que a ação apropriada será executada se o serviço for perdido. Em um ambiente do Lync, você pode estar preocupado se o serviço Enterprise Voice está disponível, se os usuários podem ingressar em conferências agendadas e assim por diante. Um SLA define uma frequência aceitável e o comprimento de interrupções e permite determinados períodos em que o sistema não está disponível para manutenção planejada.
Se você precisar fornecer relatórios ao seu gerenciamento sobre a disponibilidade de sistemas ou se tiver penalidades financeiras ou outras penalidades associadas a destinos de disponibilidade ausentes, deverá registrar dados de disponibilidade. Mesmo que você não tenha esses requisitos formais, é uma boa ideia saber com que frequência um sistema falhou em um determinado período de tempo. Por exemplo, a disponibilidade do sistema nos últimos 12 meses e quanto tempo levou para se recuperar de cada falha. Essas informações ajudarão você a medir e melhorar a eficácia da sua equipe ao responder a uma falha do sistema. Ele também poderá fornecer informações úteis se houver uma disputa.
As medidas relacionadas à disponibilidade são as seguintes:
Disponibilidade Normalmente, isso é expresso como o tempo em que um sistema ou serviço pode ser acessado em comparação com o tempo em que ele está inoperante. Normalmente, ele é expresso como uma porcentagem. (Você pode ver referências a "três noves" ou "cinco noves". Elas se referem a 99,9% ou 99,999% de disponibilidade.)
Confiabilidade Essa é uma medida do tempo entre falhas de um sistema e, às vezes, é expressa como tempo médio (ou médio) entre falhas (MTBF).
Hora de reparar Esse é o tempo necessário para recuperar um serviço após a ocorrência de uma falha e geralmente é expresso como MTTR (tempo médio) de reparo (média).
Disponibilidade, confiabilidade e tempo de reparo estão relacionados da seguinte maneira:
Availability = (MTBF – MTTR) / MTBF Por exemplo, se um servidor falhar duas vezes em um período de seis meses e não estiver disponível por uma média de 20 minutos, o MTBF será de três meses ou 90 dias e o MTTR será de 20 minutos. Portanto, Disponibilidade = (90 dias – 20 minutos) / 90 dias = 99,985%.
O gerenciamento de disponibilidade é o processo de garantir que a disponibilidade seja maximizada e mantida dentro dos parâmetros definidos em SLAs. O gerenciamento de disponibilidade inclui os seguintes processos:
Monitoramento Examinando quando e por quanto tempo os serviços estão indisponíveis.
Relatórios Os números de disponibilidade devem ser fornecidos regularmente para equipes de gerenciamento, usuários e operações. Esses relatórios devem destacar tendências e identificar áreas que estão indo bem e áreas que exigem atenção. O relatório deve resumir a conformidade com os destinos definidos nos SLAs.
Melhoria Se a disponibilidade não atender aos destinos definidos nos SLAs ou quando a tendência for para redução da disponibilidade, o processo de gerenciamento de disponibilidade deverá planejar as etapas correções. Isso deve incluir o trabalho com outras equipes responsáveis para destacar os motivos das interrupções e planejar ações corretivas para evitar uma recorrência das interrupções.
As medidas de capacidade e disponibilidade são tarefas repetitivas que são idealmente adequadas para ferramentas e scripts automatizados, como o Microsoft System Center Operations Manager (antigo Microsoft Operations Manager), que é discutido posteriormente neste documento.