Partilhar via


Monitoramento e manutenção do SharePoint Server 2013

APLICA-SE A:yes-img-132013 no-img-162016 no-img-192019 no-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

Este artigo aborda os contadores de monitorização e desempenho para farms do SharePoint Server 2013. Para manter o desempenho do sistema do SharePoint Server 2013, tem de monitorizar o servidor para identificar potenciais estrangulamentos. Antes de poder monitorar com eficácia, você deve entender os principais indicadores que informarão se houver uma parte específica do farm que requer atenção, e como saber interpretar esses indicadores. Se perceber que o farm está operando fora do plano definido, ajuste-o adicionando ou removendo recursos de hardware, modificando a topologia ou alterando a forma de armazenamento dos dados.

As informações desta seção pretendem ajudar os administradores a configurar manualmente os contadores de desempenho e outras configurações. Para obter mais informações sobre a monitorização do estado de funcionamento e a resolução de problemas com as ferramentas de monitorização do estado de funcionamento incorporadas na interface do site da Administração Central do SharePoint, leia os seguintes artigos:

Antes de ler este artigo, deve ler Capacity management and sizing overview for SharePoint Server 2013 (Descrição geral da gestão de capacidade e dimensionamento do SharePoint Server 2013).

Configurando o Monitoramento

Veja abaixo uma lista de configurações que você pode alterar para monitorar seu ambiente nos primeiros estágios; elas o ajudarão a determinar se alguma modificação é ou não necessária. O aumento dos recursos de monitoramento afetará a quantidade de espaço em disco que o banco de dados de uso precisará. Depois que o ambiente estiver estável e que este monitoramento detalhado não for mais necessário, talvez seja preciso reverter as configurações abaixo para os respectivos padrões.

Configuração Valor Observações
Proteção de Saturação do Log de Eventos
Desabilitado
O valor padrão é Habilitado. Essa proteção pode ser desabilitada para coletar o máximo possível de dados de monitoramento. Em operações normais, ela deve ser habilitada.
Cronograma do Trabalho do Temporizador
Importação de Dados de Uso do Microsoft SharePoint Foundation
5 minutos
O valor padrão é 30 minutos. A diminuição deste valor leva à importação dos dados no banco de dados de uso com mais frequência, o que é especialmente útil na solução de problemas. Em operações normais, esse valor deve ser 30 minutos.
Provedores de Diagnóstico
Habilitar todos os provedores de diagnóstico
Habilitado
O valor padrão é Desabilitado, exceto para o provedor de "Monitoramento da Integridade da Pesquisa - Eventos de Rastreamento". Esses provedores coletam dados de integridade de diversos recursos e componentes. Em operações normais, talvez seja preciso reverter para o padrão.
Defina os Intervalos de Agendamento "job-diagnostics-performance-counter-wfe-provider" e "job-diagnostics-performance-counter-sql-provider"
1 minuto
O valor padrão é 5 minutos. A diminuição deste valor pode extrair dados com mais frequência, o que é especialmente útil na solução de problemas. Em operações normais, esse valor deve ser 5 minutos.
Miscellaneous
Habilitar rastreamento de pilha de solicitações de conteúdo
Habilitado
O valor padrão é Desabilitado. A habilitação desta configuração permite o diagnóstico de falhas de solicitações de conteúdo usando o rastreamento de pilha do processo. Em operações normais, esse rastreamento deve estar desativado.
Habilitar o Painel de Desenvolvimento
Habilitado
O valor padrão é Desabilitado. A habilitação desta configuração permite o diagnóstico de páginas lentas ou de outros problemas com o uso do Painel de Desenvolvimento. Em operações normais, e desde que a solução de problemas não seja mais necessária, deve ser desabilitada.
Coleção de Dados de Uso
Uso da Importação de Conteúdo
Uso da Exportação de Conteúdo
Solicitações de Página
Uso de Recurso
Uso da Consulta de Pesquisa
Uso de Inventário de Site
Trabalhos de Timer
Uso de Classificação
Habilitado
A habilitação deste conjunto de contadores permite coletar mais dados de uso em todo o ambiente e permite uma compreensão melhor dos padrões de tráfego no ambiente.

Contadores de desempenho

Se estiver utilizando o banco de dados de uso, você poderá adicionar contadores de desempenho que o auxiliem no monitoramento e avaliação do desempenho do seu farm para o banco de dados de uso, de tal maneira que eles sejam conectados automaticamente em um intervalo específico (por padrão, 30 minutos). Deste modo, você poderá consultar o banco de dados de uso para recuperar esses contadores e fazer um gráfico dos resultados ao longo do tempo. Veja este guia de uso do cmdlet do PowerShell Add-SPDiagnosticsPerformanceCounter para adicionar o contador % Tempo do Processador ao banco de dados de uso. Ele só precisa ser executado em um dos servidores Web:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Há diversos contadores de desempenho genéricos, que você deve monitorar em qualquer sistema de servidor. A tabela abaixo descreve esses contadores de desempenho.

Contador de Desempenho Descrição
Processador
Você deve monitorar o desempenho do processador para garantir que todo o uso do processador permaneça consistentemente alto (acima de 80 por cento), pois isto indica que o sistema não conseguiria lidar com qualquer aumento repentino de atividade. E que, no estado comum, você não verá um efeito dominó, caso uma falha de componente leve a um estado de mau funcionamento dos demais componentes. Se, por exemplo, você tiver três servidores da Web, deverá se assegurar de que a média da CPU em todos os servidores seja menos de 60%, de maneira que, se um falhar, os outros dois consigam absorver a carga adicional.
Interface de Rede
Monitore a taxa de envio e recebimento dos dados pela placa da interface da rede. Essa taxa deve permanecer abaixo de 50 por cento da capacidade da rede.
Discos e Cache
Há várias opções de disco lógico, que você deve monitorar regularmente. O espaço em disco disponível é importante em qualquer estudo de capacidade, mas você também deve revisar o tempo de ociosidade do disco. Dependendo dos tipos de aplicativos ou serviços que esteja executando nos seus servidores, você pode revisar os tempos de leitura e gravação do disco. Uma fila extensa para a função de gravação ou leitura afetará o desempenho. O cache tem um grande efeito sobre as operações de leitura e gravação. Você deve monitorar crescentes falhas do cache.
Arquivo de Paginação e Memória
Monitore a quantidade de memória física disponível para alocação. Memória insuficiente levará ao uso excessivo do arquivo de paginação e a um aumento da quantidade de falhas de paginação por segundo.

Contadores do sistema

A tabela abaixo traz informações sobre contadores e objetos do sistema, que você pode adicionar ao conjunto de contadores monitorados no banco de dados de uso, utilizando o SPDiagnosticPerformanceCounter em um servidor da Web.

Objetos e Contadores Descrição
Processador
% do Tempo do Processador
Aqui você vê o uso do processador ao longo do tempo. Se estiver frequentemente muito alto, você perceberá que o desempenho está sendo negativamente afetado. Lembre-se de fazer a contagem "Total" em sistemas multiprocessadores. Você também pode medir a utilização de cada processador para garantir um desempenho equilibrado entre os núcleos.
Disco
- Comprimento Médio da Fila do Disco
Mostra a quantidade média de solicitações de leitura e gravação enfileiradas para o disco selecionado durante o intervalo da amostra. Um comprimento de fila de disco maior pode não significar um problema, desde que as leituras/gravações de disco não estejam sendo penalizadas e o sistema esteja trabalhando em criação contínua, sem expandir a fila.
Comprimento Médio da Fila de Leitura do Disco
A quantidade média de solicitações de leitura que estão enfileiradas.
Comprimento Médio da Fila de Gravação do Disco
A quantidade média de solicitações de gravação que estão enfileiradas.
Leituras de Disco/seg.
A quantidade de leituras do disco por segundo.
Gravações de Disco/seg.
A quantidade de gravações no disco por segundo.
Memória
- Mbytes Disponíveis
Este dado mostra quanta memória física está disponível para alocação. Memória insuficiente levará ao uso excessivo do arquivo de paginação e a um aumento da quantidade de falhas de paginação por segundo.
- Falhas de Cache/seg.
Este contador mostra o índice de ocorrência de falhas quando uma página é procurada no cache do sistema de arquivo sem ser encontrada. Esta pode ser uma falha de software, quando a página é encontrada na memória, ou uma falha de hardware, quando a página está no disco.
A utilização eficaz da cache para operações de leitura e escrita pode ter um efeito significativo no desempenho do servidor. Tem de monitorizar as falhas de cache aumentadas, indicadas por uma redução nas Leituras Rápidas Assíncronas/seg ou Leitura Antecipada/seg.
- Páginas/seg
Este contador mostra a taxa em que as páginas são lidas ou gravadas no disco, para solucionar falhas de página de hardware. Se aumentar, a taxa indicará problemas de desempenho do sistema todo.
Arquivo de Paginação
- % Usada e % de Pico Usada
O arquivo de paginação do servidor, também conhecido como arquivo de permuta, mantém endereços de memória "virtual" no disco. As falhas de paginação ocorrem quando um processo precisa parar e esperar enquanto os recursos "virtuais" necessários são recuperados do disco para a memória. Isto será mais frequente se a memória física for insuficiente.
NIC
- Total de Bytes/seg.
Esta é a taxa de envio e recebimento de dados pela placa de interface da rede. Poderá ter de investigar mais aprofundadamente se esta taxa for superior a 40-50 por cento de capacidade de rede. Para ajustar a investigação, monitorize Bytes recebidos/seg e Bytes Enviados/seg.
Processo
- Conjunto de Trabalho
Este contador indica o tamanho atual (em bytes) do conjunto de trabalho de um determinado processo. Esta memória é reservada para o processo, mesmo que não esteja sendo usada.
- % Tempo do Processador
Este contador indica a porcentagem do tempo do processador que é usado por um determinado processo.
Contagem de Threads (_Total)
A quantidade atual de threads.
ASP.NET
Total de Solicitações
A quantidade total de solicitações desde o início do serviço.
Solicitações Enfileiradas
O SharePoint Server 2013 fornece os blocos modulares para páginas HTML que são compostas no browser do utilizador através de HTTP. Este contador mostra a quantidade de solicitações à espera de processamento.
Tempo de Espera da Solicitação
A quantidade de milissegundos que a solicitação mais recente esperou na fila de processamento. À medida que a quantidade de eventos de espera aumenta, os usuários vão perceber uma diminuição no desempenho das páginas apresentadas.
Solicitações Rejeitadas
A quantidade total de solicitações não executadas devido à insuficiência de recursos de servidor para processá-las. Este contador representa a quantidade de solicitações que retornam o código de status HTTP 503, indicando que o servidor está ocupado demais.
Solicitações em Execução (_Total)
A quantidade de solicitações sendo executadas no momento.
Pedidos/Seg (_Total)
A quantidade de solicitações executadas por segundo. Isto representa a taxa de transferência atual do aplicativo. Com carga constante, esta quantidade deve se manter dentro de um certo intervalo, barrando outros trabalhos do servidor (como coleta de lixo, thread de limpeza de cache, ferramentas do servidor externo etc.).
Memória do .NET CLR
No. Coletas Ger 0
Apresenta o número de vezes que os objetos de geração 0 (ou seja, os objetos mais jovens e alocados mais recentemente) são recuperados pela libertação da memória desde o início da aplicação. Este número é útil como uma proporção de #Gen 0: #Gen 1: #Gen 2 para garantir que o número de coleções da Gen 2 não excede em grande medida as coleções de Gen 0, idealmente por um fator de 2.
Nº de Coletas Ger 1
Exibe a quantidade de vezes que os objetos da geração 1 são recuperados pela coleta de lixo desde o início do aplicativo.
Nº de Coletas Ger 2
Exibe a quantidade de vezes que os objetos da geração 2 são recuperados pela coleta de lixo desde o início do aplicativo. O contador é incrementado no fim de uma coleta de lixo da geração 2 (também conhecida como coleta total de lixo).
% Tempo Gasto em CL
Apresenta a percentagem de tempo decorrido que foi despendido a efetuar uma libertação da memória desde o último ciclo de libertação da memória. Normalmente, este contador indica o trabalho realizado pelo recoletor de lixo para recolher e compactar a memória em nome da aplicação. Este contador é atualizado apenas no final de cada libertação da memória. Este contador não é uma média. O respetivo valor reflete o último valor observado. Este contador deve estar abaixo dos 5% no funcionamento normal.

Contadores do SQL Server

A tabela seguinte fornece informações sobre os contadores e objetos do SQL Server.

Objetos e Contadores Descrição
Estatísticas Gerais
Este objeto fornece contadores para monitorizar a atividade geral ao nível do servidor, como o número de ligações atuais e o número de utilizadores que se ligam e desligam por segundo de computadores que estão a executar uma instância do SQL Server.
Conexões de Usuário
Este contador mostra o número de ligações de utilizador na instância do SQL Server. Se este número aumentar cerca de 500 por cento em relação à linha de base, provavelmente haverá redução de desempenho.
Bancos de dados
Este objeto fornece contadores para monitorar operações de cópia em massa, taxa de transferência de backup e recuperação e atividades de log de transações. Monitore transações e o log de transações para determinar a atividade de usuário que está ocorrendo no banco de dados e o quão cheio o log de transações está se tornando. A atividade de usuário pode determinar o desempenho do banco de dados e afetar o tamanho do log, o bloqueio e a replicação. O monitoramento da atividade de log de nível baixo para medir a atividade de usuário e o uso de recursos pode ajudar a identificar os gargalos do desempenho.
Transações/seg
Este contador mostra o número de transações numa determinada base de dados ou em toda a instância do SQL Server por segundo. Este número deve ajudá-lo a criar uma linha de base e a solucionar problemas.
Bloqueios
Este objeto fornece informações sobre bloqueios do SQL Server em tipos de recursos individuais.
Número de Bloqueios/seg.
Este contador mostra o número de impasses no SQL Server por segundo. Geralmente, deve ser 0.
Tempo de Espera Médio (ms)
Este contador mostra a média do tempo de espera para cada solicitação de bloqueio que tenha resultado em espera.
Tempo de Espera de Bloqueio (ms)
Este contador mostra o tempo total de espera para bloqueios no último segundo.
Esperas de Bloqueio/seg
Este contador mostra a quantidade de bloqueios por segundo que não puderam ser atendidos imediatamente e tiveram que aguardar por recursos.
Bloqueios
Este objeto fornece contadores para monitorizar bloqueios de recursos internos do SQL Server denominados bloqueios. O monitoramento das travas para determinar a atividade do usuário e o uso de recursos pode ajudar a identificar gargalos do desempenho.
Tempo Médio de Espera de Trava (ms)
Este contador mostra o tempo médio de espera de solicitações de trava que tiveram que esperar.
Esperas de Trava/seg.
Este contador mostra o número de solicitações de trava por segundo que não puderam ser atendidas imediatamente.
Estatísticas de SQL
Este objeto fornece contadores para monitorizar a compilação e o tipo de pedidos enviados para uma instância do SQL Server. O monitoramento do número de compilações e de recompilações de consulta e o número de lotes recebidos por uma instância do SQL Server oferece a você uma indicação da rapidez com que o SQL Server está processando consultas de usuário e com que efetividade o otimizador de consultas está processando as consultas.
Compilações do SQL/seg
Este contador indica a quantidade de vezes por segundo que o caminho de código de compilação é inserido.
Recompilações de SQL/seg.
Este contador indica a quantidade de vezes por segundo que as recompilações da instrução são acionadas.
Cache de Planos
Este objeto fornece contadores para monitorizar a forma como o SQL Server utiliza a memória para armazenar objetos como procedimentos armazenados, instruções Transact-SQL improvisadas e preparadas e acionadores.
Taxa de Acertos do Cache
Este contador indica a taxa entre os acertos do cache e pesquisas de planos.
Cache do Buffer
Este objeto fornece contadores para monitorizar a forma como o SQL Server utiliza a memória para armazenar páginas de dados, estruturas de dados internas e a cache de procedimentos e contadores para monitorizar a E/S física à medida que o SQL Server lê e escreve páginas de base de dados.
Taxa de Acertos do Cache do Buffer
Este contador mostra a porcentagem de páginas encontradas no cache do buffer sem ter que ler do disco. A proporção é o número total de acertos na cache dividido pelo número total de pesquisas em cache desde que uma instância do SQL Server foi iniciada.

Removendo gargalos

Os gargalos do sistema representam um ponto de contenção onde há recursos insuficientes para atender as solicitações de transação do usuário. Podem ser recursos de hardware físico, ambiente operacional ou de aplicativo. Geralmente, a causa do gargalo é código personalizado ineficiente ou soluções de terceiros, que se forem revisados podem produzir resultados melhores que a adição de hardware. Outra causa comum dos gargalos é uma configuração incorreta do farm ou uma implementação de solução ineficiente que estruture os dados de maneira a exigir mais recursos que o necessário. O administrador do sistema deve gerenciar gargalos pelo constante monitoramento do desempenho. Ao identificar um problema de desempenho, você deve avaliar a melhor solução para remoção do gargalo. Os contadores de desempenho e outras aplicações de monitorização de desempenho, como o SCOM, são as principais ferramentas para controlar e analisar problemas, para que possa desenvolver uma solução.

Solução de gargalo físico

Gargalos físicos estão relacionados à contenção da rede, memória, disco e processador: excesso de solicitações disputando poucos recursos físicos. Os objetos e contadores descritos no tópico Monitoramento de Desempenho indicam onde está localizado o problema de desempenho; por exemplo, processador de hardware ou ASP.NET. A solução do gargalo exige que você identifique o problema e depois faça uma ou mais alterações que amenizem o problema de desempenho.

Problemas raramente acontecem de maneira instantânea; geralmente, há uma degradação gradual do desempenho, que você pode rastrear se fizer o monitoramento regularmente, usando a ferramenta de monitoramento de desempenho ou um sistema mais sofisticado, como o SCOM. Nas duas opções, em graus variados, você pode incorporar soluções em um alerta, na forma de texto de orientação ou comandos de script.

Poderá ter de resolver problemas de estrangulamento ao efetuar alterações às configurações do hardware ou do sistema, depois de ter determinado que não são causados por uma configuração incorreta, código personalizado ineficiente ou soluções de terceiros ou implementação de soluções ineficientes. As tabelas abaixo identificam o limiar do problema e as possíveis opções de solução. Algumas das opções sugerem atualizações ou modificações de hardware.

Objetos e Contadores Problema Opções de Solução
Processador
Processador - % Tempo do Processador
Acima de 75-85%
Atualizar o processador
Aumentar o número de processadores
Adicionar outros servidores
Disco
Comprimento Médio da Fila do Disco
Aumentando gradualmente, o sistema não está em criação contínua e a fila está em processo de backup
Aumentar a quantidade ou a velocidade dos discos
Alterar a configuração da matriz para distribuir
Mover alguns dados para um servidor alternativo
% Tempo Ocioso
Menos de 90%
Aumentar o número de discos
Mover dados para um disco ou servidor alternativo
% Espaço Livre
Menos de 30%
Aumentar número de discos
Mover dados para um disco ou servidor alternativo
Memória
Mbytes Disponíveis
Menos de 2GB em um servidor da Web.
Adicionar memória.
> [! NOTA]> A memória disponível do SQL Server será baixa, por predefinição, e nem sempre indica um problema.
Falhas de Cache/seg.
Mais de 1
Adicionar memória
Aumentar a velocidade ou o tamanho do cache, se possível
Mover dados para um disco ou servidor alternativo
Páginas/seg
Mais de 10
Adicionar memória
Arquivo de Paginação
% Usada e % de Pico Usada
O arquivo de paginação do servidor, às vezes chamado de arquivo de permuta, mantém endereços de memória "virtual" no disco. As falhas de paginação ocorrem quando um processo precisa parar e esperar enquanto os recursos "virtuais" necessários são recuperados do disco para a memória. Isto será mais frequente se a memória física for inadequada.
Adicionar memória
NIC
Total de Bytes/seg.
Acima de 40-50% da capacidade da rede. Esta é a taxa de envio e recebimento de dados pela placa de interface da rede.
Investigue mais, monitorando os Bytes Recebidos/seg. e os Bytes Enviados/seg.
Reavalie a velocidade da placa de interface da rede
Verifique a quantidade, tamanho e uso dos buffers de memória
Processo
Conjunto de Trabalho
Maior do que 80% da memória total
Adicionar memória
% Tempo do Processador
Acima de 75-85%.
Aumentar a quantidade de processadores
Redistribuis carga de trabalho para servidores adicionais
ASP.NET
Reciclagens do Pool de Aplicativos
Vários por dia, causando lentidão intermitente.
Verifique se não implementou configurações que automaticamente reciclam o pool de aplicativos desnecessariamente durante todo o dia.
Solicitações Enfileiradas
Centenas ou milhares de solicitações enfileiradas.
Implementar outros servidores da Web
O máximo padrão deste contador é 5.000 e esta configuração pode ser alterada no arquivo Machine.config
Tempo de Espera da Solicitação
À medida que aumenta a quantidade de eventos em espera, os usuários vão percebendo uma degradação no desempenho da apresentação das páginas.
Implementar outros servidores da Web
Solicitações Rejeitadas
Acima de 0
Implementar outros servidores da Web

Confira também

Conceitos

Teste de desempenho para SharePoint Server 2013

Planejamento de capacidade para o SharePoint Server 2013

Outros recursos

Capacity management and sizing overview for SharePoint Server 2013