데이터 메시 체크리스트 시작하기
클라우드 규모 분석을 사용하는 데이터 여정 중에, 채택 수명 주기의 여러 단계를 발견하게 될 것입니다. 이 섹션에서는 시나리오를 단계별로 채택하는 데 도움이 되는 빠른 시작 검사 목록을 제공합니다. 이러한 단계는 다음과 같습니다.
- 1단계: 첫 번째 랜딩 존
- 2단계: 추가 데이터 도메인
- 3단계: 소비 준비 개선
- 4단계: 중요한 거버넌스 구성 요소
1단계 - 첫 번째 랜딩 존
- 첫 번째 사용 사례 정의
- 첫 번째 데이터 관리 착륙 지대 배포하기
- 첫 번째 데이터 랜딩 존 배포
- 첫 번째 수집 패턴 정의(예: 일괄 처리 parquet)
- 첫 번째 데이터 제품 개발(원시 수집, 제품 추상화)
- 적정 수준의 거버넌스 결정
- 메타데이터 요구 사항 정의(애플리케이션 정보, 스키마 메타데이터)
- 첫 번째 데이터 소비자 등록(수동 프로세스)
2단계 - 추가 데이터 도메인
- 대상 아키텍처 다듬기
- 더 많은 데이터 랜딩 존 배포
- 두 번째, 세 번째 및 네 번째 데이터 제품으로 확장
- 데이터 제품 메타데이터 리포지토리 실현(데이터베이스 또는 Excel)
- 첫 번째 컨트롤 집합 구현(데이터 품질, 스키마 유효성 검사)
- 소비 파이프라인 구현(입력을 출력으로 사용)
- 데이터 소유권 설정
3단계 - 소비 준비 개선
- 셀프 서비스 등록 및 메타데이터 수집 구현
- 다른 변환 패턴 제공(변환 프레임워크, ETL 도구 등)
- 공급자 측에서 제어 강화(용어집, 계보, 연결)
- 사용 처리를 구현하십시오: 승인, 사용 사례 메타데이터, 직접 보안 보기를 배포하십시오.
- 데이터 거버넌스 제어 보드 설정
4단계 – 중요한 거버넌스 구성 요소
- 자동화 적용(자동 보안 보기 제공)
- 강력한 데이터 거버넌스 배포, 분쟁 기관 설정
- 데이터 제품 지침 완료
- 귀하의 추가 상호 운용성 표준을 정의하십시오
- 셀프 서비스 데이터 사용 프로세스 개발
- 데이터 쿼리, 셀프 서비스, 카탈로그, 계보 기능 등을 개발합니다.
- 더 많은 데이터 마켓플레이스 기능 개발
요약
이러한 네 가지 개발 단계를 통해 1단계에서 최소 실행 가능한 제품을 설정하고, 학습하고, 2단계로 반복할 수 있습니다. 단계적 접근 방식을 진행하는 동안, 셀프 서비스, 확장 가능하고 관리된 플랫폼을 만들기 위해 성숙해집니다.