Compensações de confiabilidade para cargas de trabalho Power Platform
Uma carga de trabalho confiável atende consistentemente aos objetivos de confiabilidade definidos. Ele deve atingir as metas de resiliência estabelecidas, idealmente contornando eventos que afetam a confiabilidade. Realisticamente, no entanto, uma carga de trabalho deve tolerar e controlar o impacto de tais eventos e manter as operações em um nível predeterminado durante o mau funcionamento ativo. Mesmo durante um desastre, uma carga de trabalho confiável deve se recuperar para um estado específico dentro de um determinado período, ambos acordados entre as partes interessadas. Um plano de resposta a incidentes que permita obter detecção e recuperação rápidas é vital.
Durante a fase de design de uma carga de trabalho, é necessário considerar como as decisões baseadas nos Princípios e recomendações de design na Lista de verificação de revisão de design para Confiabilidade pode influenciar as metas e otimizações de outros pilares. Certas decisões podem beneficiar alguns pilares, mas constituem vantagens e desvantagens para outros. Este artigo descreve exemplos de vantagens e desvantagens que uma equipe de carga de trabalho pode encontrar ao projetar a arquitetura e as operações de carga de trabalho da confiabilidade.
Vantagens e desvantagens da confiabilidade com a Segurança
Compensação: Aumento da área de superfície de carga de trabalho. O pilar Segurança prioriza uma área de superfície reduzida e contida para minimizar os vetores de ataque e reduz o gerenciamento dos controles de segurança.
A confiabilidade é frequentemente obtida através da replicação. A replicação pode ocorrer no nível do componente, no nível dos dados ou até mesmo em um nível geográfico. As réplicas, por design, aumentam a área de superfície de uma carga de trabalho. A partir de uma perspectiva de segurança, uma área de superfície reduzida e contida é preferida para minimizar os vetores de ataque e agilizar o gerenciamento dos controles de segurança.
Da mesma forma, soluções de recuperação de desastres, como backups, aumentam a área de superfície de uma carga de trabalho. No entanto, eles geralmente são isolados do tempo de execução da carga de trabalho. Isso requer a implementação de controles de segurança adicionais, que podem ser específicos para a solução de recuperação de desastres.
Por questões de objetivos de confiabilidade, componentes adicionais podem ser necessários para a arquitetura, o que aumenta a área de superfície. Esse aumento da complexidade aumenta a área de superfície da carga de trabalho, adicionando novos componentes que precisam ser protegidos, possivelmente de maneiras que ainda não são usadas no sistema. Normalmente, esses componentes são acompanhados por código adicional para dar suporte a seu uso ou padrões gerais de confiabilidade, o que também aumenta a área de superfície do aplicativo.
Compensação: desvio do controle de segurança. O pilar Segurança recomenda que todos os controles permaneçam ativos em sistemas normais e sobrecarregados.
Quando uma carga de trabalho está passando por um evento de confiabilidade que está sendo resolvido na resposta ativa a incidentes, a urgência pode criar pressão para que as equipes de carga de trabalho ignorem os controles de segurança otimizados para acesso de rotina.
As atividades de solução de problemas podem fazer com que a equipe desabilite temporariamente os protocolos de segurança, deixando um sistema já sobrecarregado potencialmente exposto a riscos de segurança adicionais. Há também o risco de que os protocolos de segurança não sejam restabelecidos imediatamente.
Implementações granulares de controles de segurança, como atribuições de controle de acesso baseadas em função ou regras de firewall, introduzem complexidade e sensibilidade de configuração, aumentando a chance de configurações incorretas. Reduzir esse possível impacto na confiabilidade usando regras amplas corrói todos os três princípios de arquitetura de Confiança Zero.
Compensação: Versões antigas de software. O pilar Segurança incentiva uma abordagem "atualize-se, mantenha-se atualizado" para patches de segurança do fornecedor.
Aplicar atualizações do ciclo de lançamentos ou atualizações a bibliotecas de fornecedores, como componentes ou soluções de terceiros, pode potencialmente interromper o componente de destino, causando indisponibilidade durante a alteração. Atrasar ou evitar a aplicação de patches pode evitar os riscos potenciais de confiabilidade, mas deixa o sistema desprotegido contra ameaças em evolução.
A consideração anterior também se aplica ao código da carga de trabalho. Por exemplo, ele se aplica ao código do aplicativo que usa bibliotecas e componentes antigos. Se a atualização e implantação do código do aplicativo for vista como um risco de confiabilidade não mitigado, o aplicativo estará exposto a riscos de segurança adicionais ao longo do tempo.
Vantagens e Desvantagens da Confiabilidade com Excelência Operacional
Compensação: Maior complexidade operacional. A Excelência Operacional, assim como a própria Confiabilidade, prioriza a simplicidade.
Ter uma estratégia de monitoramento abrangente para uma carga de trabalho é uma parte fundamental da excelência operacional. A introdução de componentes adicionais em uma arquitetura para implementar padrões de design de confiabilidade resulta em mais fontes de dados para gerenciar, aumentando a complexidade da implementação de rastreamento distribuído e observabilidade.
Usar várias regiões para superar restrições de capacidade de recurso de região única e/ou implementar uma arquitetura ativa/ativa aumenta a complexidade do gerenciamento operacional da carga de trabalho. Essa complexidade é introduzida pela necessidade de gerenciar várias regiões e pela necessidade de gerenciar a replicação de dados entre elas.
Compensação: Maior esforço para gerar conhecimento e conscientização da equipe. O pilar Excelência Operacional recomenda manter um repositório de documentação para procedimentos e topologias.
À medida que uma carga de trabalho se torna mais robusta por meio da adição de componentes e padrões de confiabilidade, leva mais tempo para manter os procedimentos operacionais e a documentação de artefatos.
O treinamento se torna mais complexo à medida que o número de componentes na carga de trabalho aumenta. Essa complexidade afeta o tempo necessário para a integração e aumenta o conhecimento necessário para rastrear roteiros de produtos e orientações de nível de serviço.
Vantagens e Desvantagens da confiabilidade com Otimização de Experiência
Compensação: Agilidade reduzida. O pilar Otimização da Experiência prioriza a eficiência do usuário.
Enfatizar testes rigorosos pode atrasar o lançamento de recursos de experiência que são essenciais para a adoção.
A otimização para confiabilidade pode exagerar na minimização da complexidade, que desprioriza recursos para experiências de usuário mais envolventes, como componentes e integrações personalizados.
Compensações de confiabilidade com eficiência de desempenho
Compensação: Maior latência. A eficiência de desempenho exige um sistema para atingir metas de desempenho para fluxos de usuários e dados.
Os padrões de confiabilidade geralmente incorporam a replicação de dados para sobreviver ao mau funcionamento da réplica. A replicação introduz latência adicional para operações confiáveis de gravação de dados, o que consome parte do orçamento de desempenho de um usuário ou fluxo de dados específico.
A confiabilidade às vezes emprega várias formas de balanceamento de recursos para distribuir ou redistribuir a carga para réplicas saudáveis. Um componente dedicado usado para balanceamento geralmente afeta o desempenho da solicitação ou processo que está sendo balanceado.
Distribuir componentes através de limites geográficos ou zonas de disponibilidade para sobreviver a um impacto de escopo introduz latência de rede na comunicação entre componentes que abrangem esses limites de disponibilidade.
Processos extensivos são usados para observar a integridade de uma carga de trabalho. Embora o monitoramento seja essencial para a confiabilidade, a instrumentação pode afetar o desempenho do sistema. À medida que a observabilidade aumenta, o desempenho pode diminuir.
Compensação: Aumento do excesso de provisionamento. O pilar Eficiência de Desempenho desencoraja o excesso de provisionamento, recomendando, em vez disso, o uso de recursos apenas suficientes para satisfazer a demanda.
As operações de dimensionamento automático não são instantâneas e, portanto, não conseguem lidar de forma confiável com um aumento repentino e drástico na demanda que não pode ser moldado ou amenizado. Portanto, o provisionamento excessivo por meio de instâncias maiores ou de mais instâncias é uma tática de confiabilidade crítica para compensar o atraso entre o sinal de demanda e a criação de fornecimento. Capacidade não utilizada contraria as metas de eficiência de desempenho.
Às vezes, um componente não pode ser dimensionado em reação à demanda, e essa demanda não é totalmente previsível. Usar instâncias grandes para cobrir o pior caso leva ao desperdício de provisionamento excessivo em situações que estão fora desse caso de uso.