클라우드 환경 모니터링
비즈니스 소유자, 플랫폼 소유자 또는 애플리케이션 소유자든 관계없이 워크로드가 원활하게 실행되도록 하려면 클라우드 환경을 관찰해야 합니다. 다음 사항을 알아야 합니다.
- 애플리케이션을 사용할 수 있으며 고객의 기대에 부응하는 경우
- 조사가 필요한 보안 위협이 있습니다.
- 소비 비용은 예상 범위 내에 있습니다.
모니터링 은 플랫폼, 리소스 및 애플리케이션의 상태를 나타내는 원격 분석을 수집, 분석 및 처리하는 프로세스입니다. 효과적인 모니터링 환경에는 여러 클라우드 및 온-프레미스 환경의 리소스를 포함할 수 있는 전체 클라우드 자산이 포함됩니다.
관찰성은 외부 출력에서 내부 상태를 유추할 수 있는 정도를 측정하는 시스템의 속성입니다. 클라우드 환경을 모니터링하려면 서비스 및 프로세스를 배포해야 합니다. 또한 클라우드에서 실행되는 서비스의 동작을 관찰하고 이해할 수 있는 기능이 있어야 합니다.
모니터링의 이점
모니터링 환경에 투자하여 클라우드의 여러 측면에서 다음과 같은 이점을 얻을 수 있습니다.
가용성 및 성능: 리소스를 모니터링하여 클라우드 서비스 및 애플리케이션을 사용 가능하고 예상대로 수행할 수 있도록 합니다. 사용자에게 영향을 미치기 전에 문제를 식별하고 대응하려면 주요 메트릭을 추적하고 경고 규칙을 구성합니다.
비용 최적화: 모니터링을 사용하여 리소스 사용량을 추적하고 수요에 따라 리소스 크기를 조정합니다. 이 방법은 비용을 최적화하는 과도하게 프로비전되고 사용되지 않는 리소스를 방지하는 데 도움이 됩니다. 모니터링은 비용 초과 또는 예기치 않은 사용량 급증을 식별하고 경고할 수도 있습니다.
규정 준수: 모니터링을 사용하여 활동 로그 및 레코드를 유지 관리하여 클라우드 서비스가 정책 및 규정을 준수하는지 확인합니다. 이 데이터를 사용하는 보고서는 정기적인 감사 및 규정 준수 검사를 지원할 수 있습니다.
보안: 데이터 및 리소스를 보호하기 위해 즉시 조치를 수행할 수 있도록 보안 위협 및 취약성을 감지하는 데 도움이 되는 지속적인 모니터링을 구현합니다. 수집된 데이터를 분석하여 위협 탐지 및 대응을 수행할 수도 있습니다.
모니터링 플랫폼
효과적인 모니터링 전략에는 컴퓨팅 환경의 모든 플랫폼이 포함됩니다. Azure 외에도 온-프레미스, 다중 클라우드 및 에지 리소스가 있을 수 있습니다. 각 리소스에는 동일한 수준의 모니터링이 필요합니다. Azure 지침에 대한 클라우드 채택 프레임워크 따르고 통합 운영 전략에 모니터링을 포함합니다. 이 전략에서 기본 클라우드는 모니터링 도구 및 기타 관리 도구를 호스트합니다. 모니터링 도구는 모든 플랫폼의 모든 리소스를 모니터링합니다.
모니터링 유형
모니터링은 도구, 프로세스 및 사례를 조합해야 하는 다각적인 분야입니다. 다음 표에서는 다양한 유형의 모니터링을 구분합니다. 다양한 서비스 및 기능은 이러한 모니터링 유형의 다양한 조합을 제공할 수 있습니다. 그러나 포괄적인 모니터링 환경에는 컴퓨팅 환경의 각 플랫폼에서 이러한 모든 모니터링 유형이 포함됩니다.
Type | 설명 |
---|---|
인프라 | 인프라 모니터링에는 가상 머신, 스토리지 리소스 및 네트워크와 같은 클라우드 리소스의 성능 및 가용성이 포함됩니다. 이러한 유형의 모니터링은 기본 인프라가 최적으로 작동하도록 하여 이를 사용하는 애플리케이션의 가용성과 성능을 유지하는 데 도움이 됩니다. |
APM(애플리케이션 성능 모니터링) | APM은 클라우드에서 실행되는 애플리케이션의 성능 및 가용성을 모니터링합니다. 응답 시간, 오류 비율 및 트랜잭션 볼륨과 같은 메트릭을 추적합니다. APM은 성능 병목 상태를 식별하고 애플리케이션이 사용자 기대치를 충족하도록 합니다. |
데이터베이스 | 데이터베이스 모니터링은 클라우드 데이터베이스의 성능, 가용성 및 리소스 소비를 추적합니다. 주요 메트릭에는 쿼리 성능, 인덱스 사용량 및 잠금 상태가 포함됩니다. |
네트워크 | 네트워크 모니터링은 클라우드 환경에서 네트워크 구성 요소의 성능 및 가용성을 추적합니다. 메트릭에는 대역폭 사용량, 대기 시간 및 패킷 손실이 포함됩니다. |
보안 | 보안 모니터링은 무단 액세스, 맬웨어 및 규정 준수 위반을 포함하여 클라우드 환경 내의 보안 이벤트 및 취약성을 추적하고 분석합니다. 효과적인 보안 모니터링은 중요한 데이터를 보호하고, 규정 요구 사항을 준수하고, 비용이 많이 드는 보안 위반을 방지하는 데 도움이 됩니다. |
규정 준수 | 규정 준수 모니터링은 클라우드 환경이 규정 및 업계 표준을 준수하는지 확인하는 데 도움이 됩니다. 구성, 액세스 제어 및 데이터 처리 사례를 추적하여 관련 규정 준수를 보장합니다. |
비용 | 비용 모니터링은 클라우드 지출 및 리소스 사용량을 추적하여 비용 절감 기회를 식별하고 예산 초과를 방지합니다. 리소스 사용량을 모니터링하고, 사용되지 않은 리소스를 식별하고, 리소스 구성을 최적화하여 비용을 절감합니다. |
분산된 책임
온-프레미스 환경에서는 모든 컴퓨팅 리소스를 소유하고 관리하므로 모니터링의 모든 측면을 담당합니다. 클라우드에서 이 책임을 클라우드 공급자와 공유합니다. 선택한 배포 모델 유형에 따라 클라우드 스택의 다양한 계층을 모니터링하는 책임이 사용자에게서 클라우드 공급자로 이전될 수 있습니다.
IaaS(Infrastructure as a Service) 배포에서 클라우드 공급자는 물리적 인프라 및 가상화 계층과 같은 기본 클라우드 플랫폼을 모니터링합니다. 또한 클라우드 플랫폼에 배포하는 가상 머신에서 실행되는 운영 체제, 애플리케이션 및 데이터를 모니터링합니다. 배포 모델이 스택 위로 이동하면 클라우드 공급자는 환경을 모니터링하는 데 더 많은 책임을 져야 합니다. 이 책임은 애플리케이션 및 데이터를 포함하여 전체 스택에 대한 모니터링 책임을 클라우드 공급자에게 전송하기 때문에 SaaS(Software as a Service) 배포에서 절정에 달합니다.
클라우드 공급자의 모니터링 도구를 사용하여 스택 계층을 모니터링할 수 있지만 이러한 도구를 구성하고 수집하는 데이터를 분석해야 합니다. 조직의 다양한 구성원에게 액세스 권한을 부여하고 중요한 정보를 구분하는 데 도움이 되는 대시보드 및 경고를 만들어야 합니다. 조직에서 사용하는 다른 도구 및 티켓 시스템과 이러한 구성 요소를 통합해야 할 수도 있습니다.
클라우드 공급자는 내부 고객에게 제공하는 스택 계층에 대해 동일한 유형의 서비스를 수행해야 합니다. 계약하는 플랫폼의 상태 및 성능을 지속적으로 모니터링해야 합니다. 서비스 문제를 사전에 알릴 수 있는 대시보드 및 경고를 제공합니다. 내부 고객과 마찬가지로 클라우드 공급자가 플랫폼을 모니터링하는 방법의 복잡성에 대한 가시성은 필요하지 않으며, 사용자가 계약하는 서비스 수준 계약을 충족하는 것만 가능합니다.
역할 및 책임
대부분의 엔터프라이즈 조직에는 클라우드 환경의 전반적인 상태 및 성능을 모니터링하는 중앙 집중식 운영 팀이 있습니다.
이 팀은 일반적으로 다음을 수행합니다.
- 전체 회사에 대한 전략을 설정합니다.
- 모니터링 환경의 중앙 집중식 구성을 수행합니다.
- 애플리케이션 및 서비스와 관련된 모니터링 데이터에 액세스해야 하는 조직의 관련자에게 권한을 위임합니다.
조직에는 모니터링 환경을 유지하고 작업 기능을 수행하기 위해 모니터링 데이터에 액세스해야 하는 여러 역할이 있습니다. 각 역할에는 특정 책임에 따라 데이터를 모니터링하기 위한 요구 사항이 다릅니다. 조직의 크기에 따라 각 역할을 채우는 여러 개인이 있거나 여러 역할을 채우는 한 명의 개인이 있을 수 있습니다.
개별 조직은 책임을 다르게 분배할 수 있습니다. 다음 표에서는 일반적인 조직에 대한 역할 및 책임의 예를 보여 줍니다.
역할 | 설명 |
---|---|
클라우드 설계자 | 클라우드 설계자는 클라우드 인프라를 설계하고 감독하여 조직의 비즈니스 목표를 충족하는지 확인합니다. 클라우드 설계자는 클라우드 아키텍처의 안정성, 보안 및 확장성에 중점을 둡니다. 디지털 자산에 대한 전체적인 보기를 얻으려면 높은 수준의 원격 분석이 필요합니다. 이 원격 분석에는 리소스 사용 메트릭, APM 메트릭, 비용 및 청구 인사이트 및 규정 준수 보고서가 포함됩니다. |
플랫폼 엔지니어 | 플랫폼 엔지니어는 개발자가 애플리케이션을 배포하는 데 사용하는 플랫폼을 빌드하고 관리합니다. 플랫폼 엔지니어는 CI/CD(지속적인 통합 및 지속적인 업데이트) 파이프라인을 만들고, 클라우드 인프라를 코드(IaC)로 관리하고, 플랫폼의 확장성과 안정성을 보장할 수 있습니다. 플랫폼 엔지니어는 플랫폼의 운영 상태에 대한 원격 분석이 필요합니다. 이 원격 분석에는 컨테이너 성능 메트릭, 오케스트레이션 로그, IaC 유효성 검사 및 서비스 가용성이 포함됩니다. |
시스템 관리자 | 시스템 관리자는 클라우드의 서버, 운영 체제 및 기타 인프라 구성 요소를 관리하고 유지 관리합니다. 백업을 수행하고, 문제를 해결하며, 시스템이 최신 상태인지 확인합니다. 시스템 관리자는 CPU, 메모리 및 디스크 사용량, 네트워크 성능 및 시스템 로그를 비롯한 서버 및 OS 수준 원격 분석이 필요합니다. |
보안 엔지니어 | 보안 엔지니어는 위협으로부터 데이터와 애플리케이션을 보호하는 데 도움이 되는 보안 조치를 구현하고 관리합니다. 보안 엔지니어는 ID 관리에서 위협 탐지 및 대응에 이르기까지 모든 것을 처리합니다. 액세스 로그, 위협 탐지 경고, 취약성 평가 및 규정 준수 메트릭을 비롯한 보안 이벤트에 대한 원격 분석을 사용합니다. |
네트워크 관리자 | 네트워크 관리자는 클라우드 네트워크를 관리하고 유지 관리하여 서버, 애플리케이션 및 사용자 간에 데이터가 안전하고 효율적으로 흐르도록 합니다. 네트워크 관리자는 네트워크 구성을 처리하고, 성능을 모니터링하고, 보안 조치를 구현합니다. 네트워크 트래픽 분석, 대기 시간 측정, 패킷 손실 및 방화벽 로그를 비롯한 네트워크 중심 원격 분석이 필요합니다. |
DBA(데이터베이스 관리자) | DBA는 데이터 무결성, 성능 및 가용성을 보장하기 위해 데이터베이스를 관리하고 유지 관리합니다. DBA는 데이터베이스 백업 및 복구를 처리하고 효율성을 위해 쿼리를 최적화합니다. 쿼리 성능 메트릭, 데이터베이스 응답 시간, 트랜잭션 로그, 백업 또는 복구 상태를 포함하여 데이터베이스 성능 및 무결성에 대한 원격 분석을 사용합니다. |
개발자 | 개발자는 클라우드 플랫폼에서 실행되는 소프트웨어를 디자인, 쓰기, 테스트 및 유지 관리합니다. 개발자는 기능을 만들고 버그를 수정하여 애플리케이션이 안전하게 유지되고 잘 수행되도록 합니다. 오류 속도, 대기 시간, 응답 시간, 사용자 동작 분석 및 기능 사용 메트릭을 비롯한 애플리케이션별 원격 분석이 필요합니다. |
Azure 촉진
Azure에는 클라우드 환경에서 필요한 다양한 유형의 모니터링을 지원하는 많은 서비스가 있습니다. 각 서비스는 하나 이상의 역할을 대상으로 합니다. 서비스를 결합하여 포괄적인 모니터링 환경에 필요한 기능을 제공합니다.
서비스 | 설명 | Type | Roles |
---|---|---|---|
Azure Monitor | Azure Monitor는 Azure 모니터링 에코시스템의 중심에 있습니다. 클라우드 및 온-프레미스 환경에서 모니터링 데이터를 수집, 분석 및 응답하는 데 사용할 수 있는 포괄적인 모니터링 솔루션입니다. Azure Monitor는 인프라, 네트워크 및 애플리케이션에 대한 전체 모니터링을 제공합니다. 또한 데이터 분석, 시각화 및 다른 서비스에 대한 경고와 같은 데이터 플랫폼 및 핵심 기능을 제공합니다. | 인프라 데이터베이스 compliance |
클라우드 설계자, 플랫폼 엔지니어, 시스템 관리자, DBA |
Application Insights | Application Insights는 클라우드 애플리케이션에 대한 APM 모니터링을 제공하는 Azure Monitor의 기능입니다. | APM | 개발자 |
Azure Network Watcher | Network Watcher는 Azure의 네트워크 리소스에 대한 모니터링 및 시각화 기능을 제공합니다. 이 서비스를 사용하여 메트릭을 모니터링, 진단 및 볼 수 있습니다. Azure 가상 네트워크의 리소스에 대한 로그를 사용하거나 사용하지 않도록 설정할 수도 있습니다. | 네트워크 | 네트워크 관리자 |
Microsoft Sentinel | Microsoft Sentinel은 SIEM(클라우드 네이티브 보안 정보 이벤트 관리) 및 SOAR(보안 오케스트레이션 자동화 응답) 솔루션입니다. Azure 리소스 및 기타 구성 요소에서 보안 원격 분석을 수집하여 사이버 위협 탐지, 조사, 대응 및 사전 예방적 헌팅을 제공합니다. | 보안 | 보안 엔지니어 |
Microsoft Defender XDR | Defender XDR에는 Azure 플랫폼, 클라이언트 및 서버 Microsoft 운영 체제가 기본인 Microsoft 보안 솔루션과 Microsoft 365의 Office 365, Exchange Online 및 SharePoint를 포함한 애플리케이션이 포함되어 있습니다. 각 보안 솔루션은 AI 및 기계 학습을 사용하여 원격 분석의 상관 관계를 지정하고 조사가 필요한지 확인합니다. 허용할 수 없는 동작을 감지하면 중단을 방지하기 위한 조치를 취합니다. | 보안 | 보안 엔지니어 |
Microsoft Cost Management | Cost Management는 Microsoft 클라우드 비용을 분석, 모니터링 및 최적화하는 데 사용할 수 있는 도구 모음입니다. Cost Management는 청구 계정, 구독, 리소스 그룹 또는 관리 그룹에 액세스할 수 있는 모든 사용자가 사용할 수 있습니다. | 비용 | 클라우드 설계자 |
Azure Service Health | Service Health는 Azure 리소스가 사용하는 서비스의 상태를 제공합니다. 서비스 중단을 알리고 Azure 서비스 및 지역의 상태에 대한 개인 설정된 보기를 제공할 수 있습니다. | 인프라 | 클라우드 공급자 |