규제 산업용 클라우드 규모 분석 소개
클라우드 규모 분석은 배포 및 거버넌스의 용이성을 위해 Azure 랜딩 존을 기반으로 합니다. Azure 랜딩 존의 주요 목적은 애플리케이션 또는 워크로드가 Azure에 연결할 때 필요한 인프라가 이미 준비되어 있도록 하는 것입니다. 클라우드 규모 분석 랜딩 존을 배포하기 전에 이미 클라우드 채택 프레임워크를 통해 플랫폼 랜딩 존이 있는 Azure 랜딩 존 아키텍처를 배포해야 합니다.
소버린 워크로드의 경우 Microsoft에는 고급 소버린 제어가 필요한 조직을 위한 엔터프라이즈 규모 Azure 랜딩 존의 변형인 SLZ(소버린 랜딩 존) 가 있습니다. 클라우드 규모 분석은 이 변형의 Azure 랜딩 존에 대해 배포할 수 있습니다.
클라우드 규모 분석에는 애플리케이션 랜딩 존에 배포하는 작업이 포함됩니다. 이러한 영역은 일반적으로 랜딩 존 관리 그룹에 상주하며, 정책은 Microsoft에서 제공하는 샘플 템플릿으로 필터링됩니다.
Microsoft는 데이터 레이크하우스 및 데이터 메시 배포에 사용할 수 있는 샘플 템플릿을 제공합니다.
클라우드 규모 분석 평가
기업은 특정 사용 사례, 프로젝트 또는 엔드투엔드 클라우드 규모 분석에 대한 기술 세부 정보를 파악하기 전에 명확하거나 규범적인 지침을 찾는 경우가 많습니다. 전반적인 데이터 전략을 수립함에 따라 비즈니스가 현재 사용 범위에서 모든 전략 및 필수 원칙을 고려하는 것이 어려울 수 있습니다.
Microsoft는 이러한 과제를 염두에 두고 이 엔드투엔드 인사이트 과정의 전달 속도를 높이기 위해 클라우드 규모 분석을 위한 규범적 시나리오를 개발했습니다. 클라우드 규모 분석을 위한 계획 개발에서 설명하는 주요 테마에 부합합니다.
클라우드 규모 분석은 Microsoft Azure Well-Architected Framework 렌즈를 적용하는 동시에 Microsoft 클라우드 채택 프레임워크 기반으로 구축됩니다. Microsoft 클라우드 채택 프레임워크는 클라우드 운영 모델, 참조 아키텍처 및 플랫폼 템플릿에 대한 규범적인 지침 및 모범 사례를 제공합니다. 가장 도전적이고 정교하며 복잡한 환경의 실제 학습을 기반으로 합니다.
클라우드 규모 분석은 고객이 랜딩 존을 빌드하고 운영하여 분석 워크로드를 호스트하고 실행할 수 있는 길을 열어줍니다. 보안, 거버넌스 및 규정 준수를 기반으로 랜딩 존을 구축합니다. 자율성과 혁신을 지원하면서 확장성이 높고 모듈화가 가능합니다.
데이터 아키텍처의 기록
1980년대 후반에는 기업 전체의 서로 다른 데이터 원본을 결합한 데이터 웨어하우스 Gen1이 도입되었습니다. 2000년대 후반에는 Hadoop 및 데이터 레이크와 같은 빅 데이터 에코시스템이 도입된 Gen2가 출시되었습니다. 2010년대 중반에는 클라우드 데이터 플랫폼이 도입되었습니다. 이전 세대와 유사했지만 카파 또는 람다 아키텍처와 같은 스트리밍 데이터의 수집이 도입되었습니다. 2020년대 초반에는 데이터 레이크하우스, 데이터 메시, 데이터 패브릭 및 데이터 중심 운영 패턴의 개념이 도입되었습니다.
이러한 발전에도 불구하고 많은 조직에서는 여전히 중앙 집중식 모놀리식 플랫폼인 Gen1을 사용합니다. 이 시스템은 한 지점까지는 잘 작동합니다. 그러나 상호 종속된 프로세스, 긴밀하게 결합된 구성 요소 및 하이퍼스페이스화된 팀으로 인해 병목 현상이 발생할 수 있습니다. ETL(추출, 변환 및 로드) 작업이 두드러지고 제공 타임라인이 느려질 수 있습니다.
데이터 웨어하우스와 데이터 레이크는 여전히 중요하며 전체 아키텍처에서 중요한 역할을 합니다. 다음 문서에서는 이러한 전통적인 사례를 사용하여 확장할 때 발생할 수 있는 몇 가지 과제를 강조했습니다. 이러한 과제는 데이터 원본, 요구 사항, 팀 및 출력이 변경되는 복잡한 조직과 특히 관련이 있습니다.
클라우드 규모 분석으로 이동
현재 분석 데이터 아키텍처 및 운영 모델에는 데이터 웨어하우스, 데이터 레이크 및 데이터 레이크하우스 구조, 데이터 패브릭 또는 데이터 메시가 포함될 수 있습니다.
각 데이터 모델에는 고유한 장점과 과제가 있습니다. 클라우드 규모 분석을 사용하면 인프라와 함께 발전할 수 있도록 현재 설정에서 데이터 관리로 접근 방식을 전환할 수 있습니다.
모든 데이터 플랫폼 및 시나리오를 지원하여 토대 역할을 하고 확장을 가능하게 하는 엔드투엔드 클라우드 규모 분석 프레임워크를 만들 수 있습니다.
최신 데이터 플랫폼 및 원하는 결과
첫 번째 주요 영역 중 하나는 확장 가능하고 민첩한 최신 데이터 플랫폼을 반복적으로 빌드하여 문제를 해결하기 위한 데이터 전략을 활성화하는 것입니다.
최신 데이터 플랫폼을 사용하면 서비스 티켓에 부담을 느끼고 경쟁 비즈니스 요구 사항을 충족하기 위해 노력하는 대신 더 가치 있는 작업에 집중할 시간을 확보하여 보다 협의적인 역할을 수행할 수 있습니다. 데이터 및 분석 요구 사항을 셀프 서비스할 수 있는 플랫폼 및 시스템을 통해 비즈니스 라인을 제공하는 것입니다.
초기에 초점을 맞추면 좋은 영역은 다음과 같습니다.
데이터 품질을 개선하고, 신뢰를 촉진하고, 인사이트를 확보하여 데이터 기반 비즈니스 의사 결정을 내립니다.
조직 전반에 걸쳐 전체적인 데이터, 관리 및 분석을 대규모로 원활하게 구현합니다.
셀프 서비스 및 비즈니스 라인에 대한 유연성을 실현할 수 있도록 하는 강력한 데이터 거버넌스를 수립합니다.
완전히 통합된 환경에서 보안 및 법적 규정 준수를 유지 관리합니다.
잘 디자인되고 반복 가능한 모듈식 패턴의 기본 솔루션을 사용하여 신속하게 고급 분석 기능의 토대를 만듭니다.
분석 자산 제어
두 번째 고려 사항은 조직이 데이터 거버넌스를 구현하는 방법을 결정하는 것입니다.
데이터 거버넌스는 비즈니스 운영, 보고서 및 분석에 사용되는 데이터가 검색 가능하고 정확하며 신뢰할 수 있고 보호될 수 있는지 확인하는 방법입니다.
많은 기업의 경우 데이터와 AI가 경쟁 우위를 주도할 것이라고 기대합니다. 따라서 경영진은 데이터 중심이 되겠다는 결심으로 AI 이니셔티브를 후원하고자 합니다. 그러나 AI가 효과를 발휘하려면 AI가 사용하는 데이터를 신뢰할 수 있어야 합니다. 그렇지 않으면 의사 결정 정확도가 손상되거나, 결정이 지연되거나, 작업이 누락되어 수익에 영향을 줄 수 있습니다. 기업은 데이터의 품질이 "가비지 인, 가비지 아웃" 형태가 되는 것을 원하지 않을 것입니다. 처음에는 데이터 품질을 수정하는 것이 간단해 보일지도 모르지만, 디지털 변환이 데이터에 미치는 영향을 들여다보면 이야기는 달라집니다.
데이터는 하이브리드 다중 클라우드 및 분산 데이터 환경에 분산되어 있으므로 조직은 데이터를 제어하기 위해 데이터가 있는 장소를 찾으려 고군분투합니다. 제어되지 않는 데이터는 비즈니스에 상당한 영향을 미칠 수 있습니다. 데이터 오류는 곧 프로세스 오류와 지연으로 이어지므로 데이터 품질이 저하되면 비즈니스 운영이 영향을 받습니다. 또한 데이터 품질이 저하되면 비즈니스 의사 결정과 규정을 준수하는 기능도 영향을 받습니다. 일반적으로는 원본에서 데이터 품질을 확인하는 것이 선호됩니다. 분석 시스템의 품질 문제를 해결하는 것이 수집 단계 초기에 데이터 품질 규칙을 적용하는 것보다 더 복잡하고 비용이 많이 들 수 있기 때문입니다. 데이터 활동을 추적하고 제어하려면 데이터 거버넌스에 다음이 포함되어야 합니다.
- 데이터 검색
- 데이터 품질
- 정책 만들기
- 데이터 공유
- 메타데이터
분석 자산 보호
데이터 거버넌스의 또 다른 주요 동인은 데이터 보호입니다. 데이터 보호는 규정 법률을 준수하는 데 도움이 되며 데이터 위반을 방지할 수 있습니다. 데이터 개인 정보 보호와 증가하는 데이터 위반으로 인해 데이터 보호가 최우선 순위로 지정되었습니다. 이러한 위반은 식별 가능한 고객 개인 데이터와 같은 중요한 데이터에 대한 위험을 강조합니다. 데이터 개인 정보 위반이나 데이터 보안 위반의 결과는 많으며 여기에 다음이 포함될 수 있습니다.
- 브랜드 이미지 손실 또는 심각한 손상
- 고객 신뢰 손상 및 시장 점유율 하락
- 관련자 투자 수익률 및 임원 급여에 영향을 미치는 주가 하락
- 감사 또는 규정 준수 실패로 인한 주요 재정적 처벌
- 법적 조치
- 예를 들어 위반의 "도미노 효과"로 인해 고객의 신원이 도용당할 수 있습니다.
대부분의 경우 공개적으로 상장된 회사는 이러한 위반을 선언해야 합니다. 위반이 발생하면 고객은 해커 대신 먼저 회사를 비난할 가능성이 높습니다. 고객은 몇 달 동안 회사를 거부하거나 돌아오지 않을 수 있습니다.
데이터 개인 정보 보호에 대한 규제 법률을 준수하지 않으면 상당한 재정적 처벌을 받을 수 있습니다. 데이터를 제어하면 이러한 위험을 방지할 수 있습니다.
운영 모델 및 이점
최신 데이터 전략 플랫폼을 채택하면 조직에서 사용하는 기술은 물론 작동 방식도 바뀌게 됩니다.
클라우드 규모 분석은 사용자와 팀을 구성하고 기량을 갖추도록 하는 방법을 고려하는 데 도움이 되는 다음과 같은 규정된 지침을 제공합니다.
- 페르소나, 역할 및 책임 정의
- 민첩하고 수직적인 도메인 간 팀을 위한 제안된 구조
- Microsoft Learn을 통한 Azure 데이터 및 AI 인증을 비롯한 기술 리소스
또한 현대화 프로세스 전반에 걸쳐 최종 사용자를 참여시키고, 플랫폼을 계속 발전시키고, 새로운 사용 사례를 온보딩하는 것도 중요합니다.
아키텍처
Azure 랜딩 존은 사용자 환경에 대한 전략적 디자인 경로 및 대상 기술 상태를 나타냅니다. 랜딩 존은 배포 및 거버넌스를 용이하게 하여 향상된 민첩성과 규정 준수를 제공합니다. Azure 랜딩 존은 또한 새 애플리케이션 또는 워크로드가 사용자 환경에 배치되면 적절한 인프라가 이미 배치되어 있는지 확인합니다. Microsoft Software-as-Service 거버넌스 및 분석 솔루션과 통합된 Azure 데이터 관리 및 데이터 랜딩 존은 다음과 같은 기본 원칙을 염두에 두고 설계되었으며, 클라우드 규모 분석의 다른 요소와 결합하면 다음을 사용하도록 설정할 수 있습니다.
- 셀프 서비스
- 확장성
- 빠른 시작
- 보안
- 개인 정보 취급 방침
- 최적화된 작업
데이터 관리 랜딩 존
데이터 관리 랜딩 존은 조직 전체에서 플랫폼의 중앙 집중식 데이터 거버넌스 및 관리를 위한 기반을 제공합니다. 또한 다중 클라우드 및 하이브리드 인프라를 포함하여 전체 디지털 자산에서 데이터를 수집하기 위한 통신을 지원합니다.
데이터 관리 랜딩 존은 다음과 같은 다양한 기타 데이터 관리 및 거버넌스 기능을 지원합니다.
- 데이터 카탈로그
- 데이터 품질 관리
- 데이터 분류
- 데이터 계보
- 데이터 모델링 리포지토리
- API 카탈로그
- 데이터 공유 및 계약
팁
데이터 카탈로그, 데이터 품질 관리 또는 데이터 계보 기능에 파트너 솔루션을 사용하는 경우 데이터 관리 랜딩 존에 상주해야 합니다. 또는 Microsoft Purview를 서비스로서의 소프트웨어 솔루션으로 배포하여 데이터 관리 랜딩 존과 데이터 랜딩 존 모두에 연결할 수 있습니다.
데이터 랜딩 존
데이터 랜딩 존은 데이터 관리 랜딩 존에 대한 연결을 통해 일반적인 관리 및 거버넌스를 유지하는 동시에 사용자가 데이터에 더 익숙해지고 셀프 서비스를 사용할 수 있도록 합니다.
네트워킹, 모니터링, 데이터 수집 및 처리와 같은 표준 서비스뿐만 아니라 데이터 제품 및 시각화와 같은 사용자 지정도 호스팅합니다.
데이터 랜딩 존은 플랫폼의 확장성 지원에 있어 핵심 요소입니다. 조직의 크기와 요구 사항에 따라 하나 또는 여러 개의 랜딩 존으로 시작할 수 있습니다.
단일 및 다중 랜딩 존 중에서 어떤 방향을 선택할지 결정할 때는 지역 종속성 및 데이터 보존 요구 사항을 고려하세요. 예를 들어 특정 위치에 데이터를 유지하도록 요구하는 현지 법률이나 규정이 있는지 고려해볼 수 있습니다.
초기 결정과 무관하게 필요에 따라 데이터 랜딩 존을 추가 또는 제거할 수 있습니다. 단일 랜딩 존으로 시작하는 경우 향후 마이그레이션을 수행해야 하는 것을 방지하기 위해 여러 개의 랜딩 존으로 확장할 계획을 세우는 것이 좋습니다.
참고 항목
Microsoft Fabric이 배포된 경우 데이터 랜딩 존은 데이터 레이크 및 기타 Azure 데이터 서비스와 같은 비 소프트웨어 서비스 솔루션을 호스트합니다.
랜딩 존에 대한 자세한 내용은 클라우드 규모 분석을 위한 Azure 랜딩 존을 참조하세요.
결론
이 문서 시리즈, 특히 거버넌스, 보안, 운영 및 모범 사례 섹션을 읽었다면 배포 템플릿을 사용하여 개념 증명 환경을 설정하는 것이 좋습니다. 이러한 템플릿은 아키텍처 지침과 함께 Azure 및 Microsoft 서비스로서의 소프트웨어 기술에 대한 실습 경험을 제공합니다. 자세한 내용은 시작하기 체크리스트를 참조하세요.