SLA 및 SLO
이 단원에서는 SLA(서비스 수준 계약) 및 SLO(서비스 수준 목표)에 대해 설명합니다.
SLA(서비스 수준 계약)
SaaS는 소프트웨어일뿐만 아니라 주로 서비스이므로 SaaS와 기존 소프트웨어 제품의 한 가지 차이점은 SLA입니다. SLA는 SaaS 공급자와 작동 시간 및 연결에 대한 공급자의 약정을 설명하는 클라이언트 간의 계약입니다. SaaS 공급자가 SLA에 설명된 대로 각 서비스에 대한 서비스 수준을 달성하고 유지 관리하지 않는 경우 고객은 보상을 받을 수 있습니다.
소프트웨어 공급자에 대한 SLA 보상 및 처벌은 업계 및 비즈니스 유형에 따라 달라집니다. 가장 일반적인 두 가지 시나리오는 재무 페널티 및 서비스 크레딧입니다. 서비스 크레딧의 경우 고객은 월별 서비스 요금에 대한 크레딧을 받을 수 있습니다.
서비스에 대해 100% 가동 시간을 정의할 수 있지만 복잡한 시스템의 경우 100% 가용성을 달성하기는 어렵습니다. 대부분의 SLA는 제공할 수 있는 가용성과 관련 있습니다.
100% 가동 시간을 지정하는 SLA는 100% 가용성을 보장하지 않을 수 있습니다. 100% 가동 중지 시간은 중단이 있는 경우 고객이 계약에 따라 보상을 받을 수 있음을 의미할 수 있습니다. 고가용성 시스템을 구축하는 것은 엔지니어링 작업이며 SLA는 가동 중단을 위해 회사를 합법적으로 보호하는 방법입니다.
Microsoft SLA의 예는 온라인 서비스에 대한 SLA(서비스 수준 계약)를 참조하세요.
SLO(서비스 수준 목표)
SLO는 주요 고객 중심 SLA(서비스 수준 지표)에 설정된 측정 가능한 목표입니다. SLO는 비즈니스 또는 인프라 워크로드에 대한 고객의 경험을 측정합니다.
SLO는 SaaS 공급자가 공식적으로 협상된 SLA에서 만든 약정을 충족하는지 여부를 결정합니다. SLO 및 SLA는 클라우드 비즈니스 또는 인프라 워크로드 디자인 초기에 정의해야 합니다.
서비스 소유자는 다음을 결정하는 데 초점을 맞춰야 합니다.
- 고객 관점에서 서비스 상태의 중요한 지표인 시나리오는 무엇인가요.
- SLA를 수집하여 고객 환경에 최대한 가깝게 다가가는 방법입니다.
- SLA에 대한 SLO는 무엇인가요.
소프트웨어 업계에는 두 가지 유형의 SLO가 있습니다.
서비스 중심 SLO는 팀이 시간이 지남에 따라 서비스의 품질을 점진적으로 개선하기 위해 정의하는 전술적 목표입니다.
이러한 SLO는 엔지니어링 이정표에서 달성할 수 있는 실용적인 목표입니다. 예를 들어 서비스가 현재 99.7%의 가용성을 달성하고 있는 경우 팀은 다음 분기에 99.9%의 가용성에 도달하겠다는 목표를 설정할 수 있습니다.
고객 중심 SLO는 고객의 기대치가 완전히 충족되기 때문에 품질에 대한 추가 투자가 필요하지 않은 이상적인 미래 상태 또는 목표를 정의합니다.
SLO는 클라우드 워크로드 개발 및 운영에서 중요하며 SLA에 비해 다양한 용도로 사용됩니다. SLO는 기술 팀의 상태 및 방향을 나타내며, SLA는 제공된 서비스 및 보상 조건에 대한 고객과의 계약입니다.
Microsoft는 인터페이스, 기능 및 메트릭을 미리 정의하므로 Azure에서 서비스 수준 관리는 간단합니다. 소비자는 클라우드 워크로드를 사용할 때 서비스 제공 기대치를 관리해야 합니다.
Contoso 시나리오
Contoso와 해당 사용자 간의 간단한 SLA 계약은 먼저 다음과 같이 보장된 서비스 수준 및 SLA를 정의합니다.
- 사용자는 시스템에 액세스하여 로그인하고, 디자인을 생성하고, 시스템에서 사용 가능한 다른 기능을 사용할 수 있습니다.
- Contoso는 이전 시나리오를 다루는 서비스에 대해 99.99%의 가용성을 제공합니다.
- 최근 5분 동안의 요청은 99%에서 1,000밀리초 미만으로 처리됩니다.
SLA는 시계열 데이터의 집계입니다. SLA를 수집하는 방법이 중요합니다. 고객이 API를 사용하여 서비스와 상호 작용하는 경우 시스템 대기 시간 및 요청을 처리하는 시간을 측정하는 것은 정확한 SLA입니다. 그러나 고객이 웹 포털을 사용하여 서비스와 상호 작용하는 경우 요청을 처리하는 총 시간에는 웹 페이지의 JavaScript 성능도 포함되어야 합니다.
또한 SLA는 가동 중지 시간 및 가동 중지 시간에 직면한 고객에 대한 보상을 정의해야 합니다. 예를 들어 수신된 월별 크레딧의 백분율과 상관 관계가 있는 가동 시간 비율의 보상 구조 또는 가동 중지 시간 매 분마다 플랫 보정 시스템이 있을 수 있습니다.
SLO와 관련하여 Contoso는 다음을 정의하여 시작할 수 있습니다.
- QoS(서비스 품질): AI 모델은 사용자 요청 후 3분 이내에 새로운 디자인 아이디어를 생성해야 합니다.
- 가용성: 월별 기간 동안 99.99%.
- 용량: CPU, 스토리지, 메모리, 대기 시간, 처리량 및 크기 조정에 대한 대상 백분율 사용률입니다.
- 제품 채택: 제안된 디자인 아이디어를 수락하는 비율은 20%를 초과해야 합니다.