Partilhar via


Ferramentas de Monitoramento da Integridade (Cache do AppFabric 1.1)

Esta seção descreve as várias ferramentas e comandos disponíveis para monitorar a integridade de um cluster de cache do Microsoft AppFabric 1.1 para Windows Server. Essas ferramentas incluem o seguinte:

  • Monitor de Desempenho

  • Rastreamento de Eventos para Windows (ETW)

  • System Center Operations Manager

  • Windows PowerShell

Monitor de Desempenho

Os recursos de Cache do AppFabric instalam vários contadores de Monitor de Desempenho. Para obter mais informações sobre os contadores disponíveis, consulte Contadores de desempenho para recursos de cache do AppFabric. Você pode observar ou registrar em log alguns valores de contador para determinar uma linha de base de comportamento de cluster de cache típico. Por exemplo, na categoria AppFabric Caching:Cache, você pode observar que o valor de Total Client Requests / sec permanece dentro dos intervalos gerais e que varia com o horário do dia. Você pode usar essa linha de base para identificar uma tendência de aumentar as solicitações do cliente para o cluster de cache que pode precisar adicionar outros hosts de cache.

Para obter informações gerais sobre como usar o Monitor de Desempenho, consulte Using Performance Monitor.

Rastreamento de Eventos para Windows (ETW)

Os recursos de Cache do AppFabric usam ETW (Rastreamento de Eventos para Windows) para fornecer informações sobre status e erro relacionadas ao cluster de cache. Você pode usar o Visualizador de Eventos para examinar os logs de ETW para recursos de Cache do AppFabric.

  1. Abra o Visualizador de Eventos em um host de cache. Para obter instruções sobre como iniciar o Visualizador de Eventos, consulte Start Event Viewer.

  2. No painel de navegação esquerdo, expanda a pasta Logs de Aplicativos e Serviços.

  3. Em seguida, expanda Microsoft, Windows e Application Server-System Services.

  4. Selecione o log Admin.

O log Admin contém atualizações informativas, como quando o Serviço de Cache do AppFabric é iniciado ou interrompido. Ele também contém avisos e erros. Observe que esses logs podem conter eventos de outros recursos do AppFabric, como hospedagem e monitoramento. Você pode optar por filtrar o log apenas para a origem Microsoft-Windows Server AppFabric Caching, a fim de se concentrar nos eventos relacionados aos recursos de Cache do AppFabric.

A pasta Application Server-System Services também contém um log Operacional. Por padrão, esse log está desabilitado. Para habilitá-lo, clique com o botão direito do mouse no log Operacional do painel de navegação e clique em Habilitar Log. O log Operacional contém outros eventos, como condições de pouca memória.

Ao avaliar a integridade do cluster de cache, é importante examinar os logs de eventos em cada um dos hosts de cache que pertencem ao cluster. Um problema com um host de cache pode ter efeito negativo em todo o cluster de cache.

O visualizador de eventos é útil para monitorar regularmente a integridade do cluster de cache. No entanto, ao solucionar problemas de um erro, é possível obter um log ainda mais detalhado das atividades do cluster de cache. Isso pode ser feito com a ferramenta tracelog.exe. A ferramenta tracelog.exe cria um log de rastreamento ETL detalhado na linha de comando. Você pode baixar o utilitário de log de rastreamento como parte do Windows Software Development Kit. O seguinte comando começa a registrar em log o arquivo cachedebugtrace.etl:

tracelog -start debugtrace -f cachedebugtrace.etl -guid "C:\Program Files\Windows Server AppFabric\Manifests\ProviderGUID.txt" -level 5 -cir 512

O seguinte comando interrompe o registro em log:

tracelog -stop debugtrace

O seguinte comando converte o arquivo cachedebugtrace.etl do log em um arquivo de texto denominado cachedebugtrace.csv.

tracerpt .\cachedebugtrace.etl -o cachedebugtrace.csv -of CSV

Dica

Embora a ferramenta traceprt permita que você exiba o conteúdo do arquivo de log gerado por tracelog, convém trabalhar com o suporte Microsoft para interpretar totalmente as informações.

System Center Operations Manager

Você pode usar o System Center Operations Manager para monitorar a integridade do cluster de cache do AppFabric. Para obter mais informações, consulte Windows Server AppFabric Management Pack for Operations Manager 2007.

Windows PowerShell

Há vários comandos do Windows PowerShell que indicam o status e a integridade atuais de um cluster de cache. Esta seção demonstra como usar os comandos a seguir.

  • Get-CacheHost

  • Get-CacheClusterHealth

  • Get-CacheStatistics

Observe que esses comandos fornecem informações dinâmicas com base no estado atual do cluster de cache. Geralmente, é útil verificar os detalhes da configuração com os seguintes comandos: Get-CacheConfig, Get-CacheHostConfig e Export-CacheClusterConfig. Esses comandos são abordados na seção Tarefas comuns de gerenciamento de cluster de cache (Cache do AppFabric 1.1).

Dica

Para obter mais informações sobre como começar a usar o Windows PowerShell, consulte Tarefas comuns de gerenciamento do cluster de cache (Cache do Windows Server AppFabric). Para obter uma lista completa de comandos, consulte Usando o Windows PowerShell com cache do AppFabric.

Get-CacheHost

Use o comando Get-CacheHost sem nenhum parâmetro para exibir rapidamente o status dos hosts de cache no cluster de cache. Ocorrem alguns problemas quando um ou mais hosts de cache não estão funcionando em um cluster. Por exemplo, considere a seguinte saída de Get-CacheHost.

PS C:\> Get-CacheHost

HostName : CachePort      Service Name            Service Status Version Info
--------------------      ------------            -------------- ------------
CacheServer1:22233        AppFabricCachingService UP             1 [1,1][1,1]
CacheServer2:22233        AppFabricCachingService DOWN           1 [1,1][1,1]
CacheServer3:22233        AppFabricCachingService UP             1 [1,1][1,1]

Essa saída mostra que há três hosts de cache no cluster: CachServer1, CacheServer2 e CacheServer3. A coluna Service Status indica que o cluster de cache está sendo executado, pois o status de pelo menos um host de cache é UP. No entanto, CacheServer2 está parado no momento e seu status é DOWN. Isso poderá indicar um problema com CacheServer2 ou talvez baste você iniciar o host de cache com o comando Start-CacheHost. O comando Get-CacheHost geralmente é o primeiro comando que você deve executar para obter uma visão geral de alto nível do estado do cluster de cache.

Get-CacheClusterHealth

Use Get-CacheClusterHealth para obter informações detalhadas sobre a integridade dos hosts de cache e dos caches que residem nesses hosts. Por exemplo, considere o seguinte exemplo de saída do comando Get-CacheClusterHealth.

Cluster health statistics
=========================

HostName = CacheServer1
-------------------------

    NamedCache = default
        Healthy              = 0.00
        UnderReconfiguration = 0.00
        NotPrimary           = 0.00
        NoWriteQuorum        = 0.00
        Throttled            = 25.00

    NamedCache = Cache1
        Healthy              = 0.00
        UnderReconfiguration = 0.00
        NotPrimary           = 0.00
        NoWriteQuorum        = 0.00
        Throttled            = 25.00


HostName = CacheServer2
-------------------------

    NamedCache = Cache1
        Healthy              = 25.00
        UnderReconfiguration = 0.00
        NotPrimary           = 0.00
        NoWriteQuorum        = 0.00
        Throttled            = 0.00

    NamedCache = default
        Healthy              = 25.00
        UnderReconfiguration = 0.00
        NotPrimary           = 0.00
        NoWriteQuorum        = 0.00
        Throttled            = 0.00


Unallocated named cache fractions
---------------------------------

Internamente, o cluster de cache usa um conceito de partições para organizar e gerenciar a memória. Os números exibidos na saída do comando Get-CacheClusterHealth são as porcentagens do número total de partições do cluster de cache. Por exemplo, em CacheServer2, o cache nomeado Cache1 está usando 25.00 por cento do total de partições e todas essas partições estão funcionando. No entanto, as porcentagens específicas não são tão importantes quanto as categorias em que essas porcentagens residem. A adição de mais caches ou hosts de cache pode reduzir Cache1 de 25.00 por cento para 10.00 por cento, porém enquanto os 10.00 por cento ainda estiverem na categoria Healthy, o cache ainda estará funcionando. No exemplo anterior, observe que CacheServer1 está mostrando os dois caches como Throttled. Esta é uma condição de pouca memória no servidor. Para obter mais informações sobre como solucionar problemas dessa condição de pouca memória, consulte Solução de problemas de limitação (Cache do Windows Server AppFabric).

A tabela a seguir descreve cada categoria da saída Get-CacheClusterHealth.

Categoria de integridade Descrição

Healthy

O cache está operando normalmente. Esse é o estado de destino de todos os caches.

UnderReconfiguration

O cache está em reconfiguração. Esse é um estado interno que pode ter várias caussas, mas deve ser temporário e ser resolvido para a integridade.

NotPrimary

O cache não está disponível no momento. Isso pode ocorrer quando cópias secundárias são promovidas para primárias. Durante esta transição, o estado do cache pode ser temporariamente NotPrimary. Este estado geralmente deve resolver para a integridade.

NoWriteQuorum

O cache é somente leitura, pois não pode criar o número necessário de réplicas em hosts de cache secundários. Isso ocorre quando o cache tem a opção de alta disponibilidade habilitada (Secondaries = 1). Neste cenário, deve haver pelo menos dois hosts de cache em execução no cluster, um para a cópia primária do item armazenado em cache e outro para a cópia secundária.

Throttled

O cache é somente leitura porque o host de cache está em um estado de memória limitado. Esta é uma condição de pouca memória.

Unallocated named cache fractions representa a porcentagem de partições de cache que não foram alocadas para um host de cache específico ainda. Esse estado normalmente aparece quando o cluster de cache é iniciado ou quando um host de cache é iniciado ou interrompido no cluster em execução. Este estado geralmente deve resolver para a integridade.

Get-CacheStatistics

O comando Get-CacheStatistics do Windows PowerShell fornece informações básicas sobre o conteúdo de um cache. O exemplo a seguir demonstra como exibir as estatística de cache para um cache denominado Cache1.

Get-CacheStatistics Cache1

Este é um exemplo de saída do comando anterior.

Size         : 12408186
ItemCount    : 1200
RegionCount  : 714
RequestCount : 1200
MissCount    : 1200

A saída anterior mostra que há 1.200 itens em Cache1 para um tamanho total de 12408186 bytes. Há 714 regiões, que poderão ser criadas pelo usuário ou criadas pelo sistema. Havia 1.200 solicitações e o mesmo número de perdas. No entanto, é importante não ver o MissCount como um indicador de problema no isolamento. Quando o cluster de cache é reiniciado, os aplicativos devem preencher novamente o cache. Isso envolve verificar se o item armazenado em cache existe, o que incrementa o MissCount. Um MissCount alto poderá indicar que os itens no cache foram inesperadamente removidos ou que o tempo de expiração dos itens armazenados em cache é muito baixo, mas essas condições não podem ser confirmadas apenas com as estatísticas de cache. Por exemplo, se você usar o método Put para adicionar um item que não está no cache, ele incrementará MissCount, mas esta não será uma condição de erro.

Esse comando pode ser usado junto com o comando Get-CacheConfig. Por exemplo, se o comando Get-CacheStatistics mostrou que Cache1 tinha um tamanho inesperadamente grande de 1 GB, você poderá examinar a configuração do cache com Get-CacheConfig para ver as configurações de expiração e remoção.

Consulte também

Conceitos

Gerenciando a integridade do cluster de cache (Cache do Windows Server AppFabric)

  2012-03-05