SLA e SLO

Concluído

Esta unidade discute os Contratos de Nível de Serviço (SLAs) e os Objetivos de Nível de Serviço (SLOs).

Contrato de Nível de Serviço (SLA)

Como o SaaS não é apenas software, mas é principalmente um serviço, uma diferença entre o SaaS e os produtos de software tradicionais é o SLA. O SLA é um contrato entre um provedor de SaaS e um cliente que descreve os compromissos do provedor para tempo de atividade e conectividade. Se o provedor de SaaS não atingir e manter os níveis de serviço para cada serviço, conforme descrito no SLA, os clientes poderão ser elegíveis para compensação.

A compensação de SLA e as penalidades para fornecedores de software dependem do setor e do tipo de negócio. Os dois cenários mais comuns são penalidade financeira e créditos de serviço. Para créditos de serviço, os clientes podem ser elegíveis para um crédito em relação às suas taxas de serviço mensais.

Embora você possa definir 100% de tempo de atividade para o seu serviço, é difícil alcançar 100% de disponibilidade para sistemas complexos. A maioria dos SLAs está ligada à disponibilidade que eles podem fornecer.

Um SLA que especifica 100% de tempo de atividade pode não garantir 100% de disponibilidade. O tempo de atividade de 100% pode significar que, se houver interrupções, os clientes recebem uma compensação de acordo com o contrato. Construir sistemas altamente disponíveis é uma tarefa de engenharia, enquanto o SLA é uma forma de proteger legalmente uma empresa em caso de interrupções.

Para obter exemplos de SLAs da Microsoft, consulte Contratos de Nível de Serviço (SLA) para Serviços Online.

Objetivos de nível de serviço (SLOs)

Os SLOs são metas mensuráveis definidas nos principais indicadores de nível de serviço (SLIs) centrados no cliente. Os SLOs medem a experiência do cliente em relação a uma carga de trabalho de negócios ou infraestrutura.

Os SLOs determinam se o provedor de SaaS está cumprindo os compromissos assumidos em um SLA negociado formalmente. SLOs e SLIs devem ser definidos no início do projeto de qualquer negócio de nuvem ou carga de trabalho de infraestrutura.

O foco para os proprietários de serviços é determinar:

  • Quais cenários são indicadores críticos da integridade do serviço do ponto de vista do cliente.
  • Como reunir SLIs para que estejam o mais próximo possível da experiência do cliente.
  • Quais devem ser os SLOs para os SLIs.

Existem dois tipos de SLOs na indústria de software:

  • SLOs centrados em serviços são objetivos táticos que as equipes definem para melhorar gradualmente a qualidade de seu serviço ao longo do tempo.

    Esses SLOs são metas pragmáticas que são alcançáveis em um marco de engenharia. Por exemplo, se um serviço está atualmente atingindo 99,7% de disponibilidade, a equipe pode definir uma meta para atingir 99,9% de disponibilidade no próximo trimestre.

  • SLOs centrados no cliente definem o estado ou objetivo futuro ideal além do qual novos investimentos em qualidade são desnecessários, porque as expectativas dos clientes são totalmente atendidas.

Os SLOs são importantes no desenvolvimento e nas operações de carga de trabalho na nuvem e servem a propósitos diferentes em comparação com os SLAs. Um SLO indica o estado e a direção das equipes de tecnologia, enquanto o SLA é um contrato com os clientes sobre os termos dos serviços prestados e compensação.

No Azure, o gerenciamento de nível de serviço é leve, porque a Microsoft predefine as interfaces, a funcionalidade e as métricas. Os consumidores precisam gerenciar suas expectativas de prestação de serviços quando usam cargas de trabalho na nuvem.

Cenário da Contoso

Um contrato de SLA simples entre a Contoso e seus usuários primeiro define os níveis de serviço garantidos e SLIs, como:

  • Os usuários podem acessar e entrar no sistema, gerar designs e usar outras funcionalidades disponíveis no sistema.
  • A Contoso fornece 99,99% de disponibilidade para seus serviços que abrangem os cenários anteriores.
  • Os pedidos nos últimos cinco minutos são atendidos em menos de 1.000 milissegundos a 99%.

Os SLIs são agregações de dados de séries temporais. A forma como os SLIs são reunidos é importante. Se o cliente interage com o serviço usando uma API, medir a latência do sistema e o tempo para processar solicitações são SLIs precisos. Mas se o cliente interage com o serviço usando um portal da web, o tempo total para atender a solicitação também deve incluir o desempenho JavaScript da página da web.

O SLA também deve definir o tempo de inatividade e a compensação para os clientes que enfrentam tempo de inatividade. Por exemplo, pode haver uma estrutura de compensação de porcentagem de tempo de atividade correlacionada com a porcentagem de créditos mensais recebidos, ou um sistema de compensação fixa para cada minuto de tempo de inatividade.

Em relação aos SLOs, a Contoso pode começar definindo:

  • Qualidade de Serviço (QoS): O modelo de IA deve gerar novas ideias de design dentro de 3 minutos após uma solicitação do usuário.
  • Disponibilidade: 99,99% durante um período mensal.
  • Capacidade: Utilização percentual de destino para CPU, armazenamento, memória, latência, taxa de transferência e dimensionamento.
  • Adoção do produto: A taxa de aceitação das ideias de design propostas deve ser superior a 20%.