Partilhar via


Práticas recomendadas para um desempenho ideal

A Instância Gerenciada do Azure para Apache Cassandra é um serviço totalmente gerenciado para clusters Apache Cassandra de código aberto puro. O serviço também permite que as configurações sejam substituídas, dependendo das necessidades específicas de cada carga de trabalho, permitindo a máxima flexibilidade e controle onde necessário. Este artigo fornece dicas sobre como otimizar o desempenho.

Instalação e configuração ideais

Fator de replicação, número de discos, número de nós e SKUs

Como o Azure dá suporte a três zonas de disponibilidade na maioria das regiões e a Instância Gerenciada Cassandra mapeia zonas de disponibilidade para racks, recomendamos escolher uma chave de partição com alta cardinalidade para evitar partições ativas. Para obter o melhor nível de confiabilidade e tolerância a falhas, é altamente recomendável configurar um fator de replicação de 3. Também recomendamos especificar um múltiplo do fator de replicação como o número de nós, por exemplo, 3, 6, 9, etc.

Usamos um RAID 0 sobre o número de discos provisionados. Portanto, para obter as IOPS ideais, você precisa verificar as IOPS máximas na SKU que você escolheu juntamente com as IOPS de um disco P30. Por exemplo, o Standard_DS14_v2 SKU suporta 51.200 IOPS não armazenadas em cache, enquanto um único disco P30 tem um desempenho básico de 5.000 IOPS. Assim, quatro discos levariam a 20.000 IOPS, o que está bem abaixo dos limites da máquina.

Recomendamos vivamente uma análise comparativa extensiva da sua carga de trabalho em relação à SKU e ao número de discos. O benchmarking é especialmente importante no caso de SKUs com apenas oito núcleos. Nossa pesquisa mostra que oito CPUs principais só funcionam para as cargas de trabalho menos exigentes, e a maioria das cargas de trabalho precisa de um mínimo de 16 núcleos para ter desempenho.

Cargas de trabalho analíticas vs. transacionais

As cargas de trabalho transacionais normalmente precisam de um data center otimizado para baixa latência, enquanto as cargas de trabalho analíticas geralmente usam consultas mais complexas, que levam mais tempo para serem executadas. Na maioria dos casos, você desejaria centros de dados separados:

  • Um otimizado para baixa latência
  • Um otimizado para cargas de trabalho analíticas

Otimização para cargas de trabalho analíticas

Recomendamos que os clientes apliquem as seguintes cassandra.yaml configurações para cargas de trabalho analíticas (veja aqui como se candidatar).

Tempos limite

Value Cassandra MI Padrão Recomendação para carga de trabalho analítica
read_request_timeout_in_ms    5,000   10,000
range_request_timeout_in_ms 10,000 20.000
counter_write_request_timeout_in_ms  5,000 10.000
cas_contention_timeout_in_ms 1,000 2.000
truncate_request_timeout_in_ms 60,000 120 000
slow_query_log_timeout_in_ms 500 1,000
roles_validity_in_ms 2,000 120 000
permissions_validity_in_ms 2,000 120 000

Caches

Value Cassandra MI Padrão Recomendação para carga de trabalho analítica
file_cache_size_in_mb 2,048 6,144

Mais recomendações

Value Cassandra MI Padrão Recomendação para carga de trabalho analítica
commitlog_total_space_in_mb 8,192 16,384
column_index_size_in_kb 64 16
compaction_throughput_mb_per_sec 128 256

Definições do cliente

Recomendamos aumentar os tempos limite do driver do cliente Cassandra de acordo com os tempos limite aplicados no servidor.

Otimização para baixa latência

Nossas configurações padrão já são adequadas para cargas de trabalho de baixa latência. Para garantir o melhor desempenho para latências finais, é altamente recomendável usar um driver de cliente que suporte a execução especulativa e configurar seu cliente de acordo. Para o driver Java V4, você pode encontrar uma demonstração ilustrando como isso funciona e como ativar a política aqui.

Monitoramento de gargalos de desempenho

Desempenho da CPU

Como todo sistema de banco de dados, Cassandra funciona melhor se a utilização da CPU é de cerca de 50% e nunca fica acima de 80%. Você pode visualizar as métricas da CPU na guia Métricas em Monitoramento do portal:

Captura de tela das métricas da CPU por uso ocioso.

Gorjeta

Para uma visualização realista da CPU, adicione um filtro e divida a propriedade por Usage kind=usage_idle. Se esse valor for inferior a 20%, você poderá aplicar a divisão para obter o uso por todos os tipos de uso.

Captura de tela das métricas da CPU por tipo de uso.

Se a CPU estiver permanentemente acima de 80% para a maioria dos nós, o banco de dados ficará sobrecarregado, manifestando-se em vários tempos limite do cliente. Nesse cenário, recomendamos executar as seguintes ações:

  • dimensionar verticalmente para uma SKU com mais núcleos de CPU (especialmente se os núcleos forem apenas 8 ou menos).
  • dimensionar horizontalmente adicionando mais nós (como mencionado anteriormente, o número de nós deve ser múltiplo do fator de replicação).

Se a CPU é alta apenas para alguns nós, mas baixa para os outros, isso indica uma partição quente e precisa de mais investigação.

Nota

A alteração de SKU é suportada por meio do Portal do Azure, da CLI do Azure e da implantação de modelo ARM. Você pode implantar/editar o modelo ARM e substituir o SKU por um dos seguintes.

  • Standard_E8s_v4
  • Standard_E16s_v4
  • Standard_E20s_v4
  • Standard_E32s_v4
  • Standard_DS13_v2
  • Standard_DS14_v2
  • Standard_D8s_v4
  • Standard_D16s_v4
  • Standard_D32s_v4
  • Standard_L8s_v3
  • Standard_L16s_v3
  • Standard_L32s_v3
  • Standard_L8as_v3
  • Standard_L16as_v3
  • Standard_L32as_v3

Observe que, atualmente, não suportamos a transição entre famílias de SKU. Por exemplo, se você possui atualmente um Standard_DS13_v2 e está interessado em atualizar para um SKU maior, como Standard_DS14_v2, esta opção não está disponível. No entanto, você pode abrir um tíquete de suporte para solicitar uma atualização para a SKU mais alta.

Desempenho do disco

O serviço é executado em discos gerenciados do Azure P30, que permitem "IOPS de intermitência". É necessário um monitoramento cuidadoso quando se trata de gargalos de desempenho relacionados ao disco. Neste caso, é importante rever as métricas IOPS:

Captura de tela das métricas de E/S de disco.

Se as métricas mostrarem uma ou todas as características a seguir, isso pode indicar que você precisa aumentar a escala.

  • Consistentemente maior ou igual ao IOPS base (lembre-se de multiplicar 5.000 IOPS pelo número de discos por nó para obter o número).
  • Consistentemente maior ou igual ao IOPS máximo permitido para o SKU para gravações.
  • Sua SKU suporta armazenamento em cache (write-through-cache) e esse número é menor do que as IOPS dos discos gerenciados (esse será o limite superior para suas IOPS de leitura).

Se você vir o IOPS elevado apenas para alguns nós, poderá ter uma partição ativa e precisar revisar seus dados para uma possível inclinação.

Se as IOPS forem inferiores às suportadas pela SKU escolhida, mas superiores ou iguais às IOPS do disco, pode executar as seguintes ações:

Se o seu IOPS exceder o máximo que o seu SKU suporta, você pode:

Para obter mais informações, consulte Máquina virtual e desempenho do disco.

Desempenho da rede

Na maioria dos casos, o desempenho da rede é suficiente. No entanto, se você estiver transmitindo dados com frequência (como escala/redução horizontal frequente) ou se houver grandes movimentos de dados de entrada/saída, isso pode se tornar um problema. Pode ser necessário avaliar o desempenho de rede do seu SKU. Por exemplo, o Standard_DS14_v2 SKU suporta 12.000 Mb/s, compare isso com o byte-in/out nas métricas:

Captura de tela das métricas de rede.

Se você vir a rede elevada apenas para alguns nós, talvez tenha uma partição ativa e precise revisar seus padrões de distribuição e/ou acesso de dados para uma possível inclinação.

  • Dimensione verticalmente para uma SKU diferente, suportando mais E/S de rede.
  • Aumente horizontalmente a escala do cluster adicionando mais nós.

Demasiados clientes ligados

As implantações devem ser planejadas e provisionadas para dar suporte ao número máximo de solicitações paralelas necessárias para a latência desejada de um aplicativo. Para uma determinada implantação, a introdução de mais carga no sistema acima de um limite mínimo aumenta a latência geral. Monitore o número de clientes conectados para garantir que isso não exceda os limites toleráveis.

Captura de tela das métricas do cliente conectado.

Espaço em disco

Na maioria dos casos, há espaço em disco suficiente, pois as implantações padrão são otimizadas para IOPS, o que leva à baixa utilização do disco. No entanto, aconselhamos ocasionalmente a revisão das métricas de espaço em disco. Cassandra acumula muitos discos e depois reduz-os quando a compactação é acionada. Por isso, é importante revisar o uso do disco por períodos mais longos para estabelecer tendências - como compactação incapaz de recuperar espaço.

Nota

Para garantir espaço disponível para compactação, a utilização do disco deve ser mantida em cerca de 50%.

Se você vir esse comportamento apenas para alguns nós, talvez tenha uma partição ativa e precise revisar seus padrões de distribuição e/ou acesso de dados para uma possível inclinação.

  • adicione mais discos, mas esteja atento aos limites de IOPS impostos pela sua SKU
  • Dimensionar horizontalmente o cluster

Memória JVM

Nossa fórmula padrão atribui metade da memória da VM à JVM com um limite superior de 31 GB - o que, na maioria dos casos, é um bom equilíbrio entre desempenho e memória. Algumas cargas de trabalho, especialmente aquelas que têm leituras frequentes entre partições ou varreduras de intervalo podem ser desafiadas pela memória.

Na maioria dos casos, a memória é recuperada efetivamente pelo coletor de lixo Java, mas especialmente se a CPU estiver frequentemente acima de 80%, não há ciclos de CPU suficientes para o coletor de lixo restante. Portanto, quaisquer problemas de desempenho da CPU devem ser resolvidos antes dos problemas de memória.

Se a CPU pairar abaixo de 70% e a coleta de lixo não conseguir recuperar memória, talvez você precise de mais memória JVM. Este é especialmente o caso se você estiver em um SKU com memória limitada. Na maioria dos casos, você precisa revisar suas consultas e configurações do cliente e reduzir fetch_size junto com o que é escolhido em limit sua consulta CQL.

Se você realmente precisa de mais memória, você pode:

  • Registre um ticket para que possamos aumentar as configurações de memória da JVM para você
  • Dimensionar verticalmente para uma SKU que tenha mais memória disponível

Lápides

Realizamos reparos a cada sete dias com ceifador, que remove linhas cujo TTL expirou (chamado de "lápide"). Algumas cargas de trabalho têm exclusões mais frequentes e veem avisos como Read 96 live rows and 5035 tombstone cells for query SELECT ...; token <token> (see tombstone_warn_threshold) nos logs de Cassandra, ou até mesmo erros indicando que uma consulta não pôde ser atendida devido ao excesso de lápides.

Uma mitigação de curto prazo se as consultas não forem atendidas é aumentar a tombstone_failure_threshold configuração Cassandra do padrão 100.000 para um valor mais alto.

Além disso, recomendamos rever o TTL no espaço de chaves e, potencialmente, executar reparos diariamente para limpar mais lápides. Se os TTLs forem curtos, por exemplo, menos de dois dias, e os dados entrarem e forem excluídos rapidamente, recomendamos rever a estratégia de compactação e favorecer o Leveled Compaction Strategy. Em alguns casos, tais ações podem ser uma indicação de que é necessária uma revisão do modelo de dados.

Avisos de lote

Você pode encontrar esse aviso no CassandraLogs e falhas potencialmente relacionadas:

Batch for [<table>] is of size 6.740KiB, exceeding specified threshold of 5.000KiB by 1.740KiB.

Neste caso, deve rever as suas consultas para ficar abaixo do tamanho de lote recomendado. Em casos raros e como uma mitigação de curto prazo, você pode aumentar batch_size_fail_threshold_in_kb na configuração Cassandra do padrão de 50 para um valor mais alto.  

Aviso de partição grande

Você pode encontrar este aviso no CassandraLogs:

Writing large partition <table> (105.426MiB) to sstable <file>

Isso indica um problema no modelo de dados. Aqui está um artigo de estouro de pilha que entra em mais detalhes. Isso pode causar sérios problemas de desempenho e precisa ser resolvido.

Otimizações especializadas

Compressão

Cassandra permite a seleção de um algoritmo de compressão apropriado quando uma tabela é criada (consulte Compressão) O padrão é LZ4, que é excelente para taxa de transferência e CPU, mas consome mais espaço no disco. Usando Zstd (Cassandra 4.0 e superior) economiza cerca de ~ 12% de espaço com sobrecarga mínima de CPU.

Otimizando o espaço de pilha do memtable

Nosso padrão é usar 1/4 da pilha da JVM para memtable_heap_space no cassandra.yaml. Para aplicações orientadas para escrita e/ou em SKUs com memória pequena, isso pode levar a descargas frequentes e fragmentados, exigindo assim mais compactação. Nesses casos, o aumento para pelo menos 4048 pode ser benéfico, mas requer uma avaliação comparativa cuidadosa para garantir que outras operações (por exemplo, leituras) não sejam afetadas.

Próximos passos

Neste artigo, apresentamos algumas práticas recomendadas para um desempenho ideal. Agora você pode começar a trabalhar com o cluster: