데이터 수명 주기 관리
데이터 수명 주기 관리는 특정 정책을 사용하여 시스템 내에 있는 전체 시간 동안 데이터를 효과적으로 관리하는 방법입니다. 이러한 정책은 데이터 관리 프로세스를 구동하는 가장 중요한 스토리지 및 데이터 정책으로 구성되어야 합니다. 비즈니스 목표와 동인은 데이터 수명 주기 관리 정책을 규정하므로 일반적으로 전체 IT 거버넌스, 관리 및 SLA(서비스 수준 계약)의 프레임워크에 연결됩니다.
데이터 형식과 사용 방법을 알고 나면 가장 가능성이 큰 진화와 운명을 이미 알고 있습니다. 데이터가 어떻게 진화하는지 이해하고, 증가하는 방식을 결정하고, 시간에 따른 사용량의 변화를 모니터링하고, 존재하는 기간을 결정하고, 해당 데이터에 적용되는 모든 규칙과 규정을 준수해야 합니다.
데이터 수명 주기 관리는 팀이 데이터 수명 주기의 각 단계에 적절한 기술을 사용할 수 있도록 프로세스, 정책 및 소프트웨어의 조합을 사용하여 이러한 요구 사항을 해결합니다.
데이터의 수명 주기
데이터 제품마다 수명 주기가 다를 수 있습니다. 일반적인 수명 주기 패턴은 새로 수집된 데이터가 보다 자주 사용되고 액세스된다는 것입니다. 데이터가 존재한 기간이 길수록 액세스 비율이 감소하는 경우가 많으며, 오래된 데이터는 사용량이 급격히 감소합니다. 일부 데이터 제품은 생성 후 며칠 또는 몇 달 후에 만료될 수 있지만, 어떤 데이터 제품은 전체 수명 동안 적극적으로 사용 및 수정됩니다.
그러나 데이터 수명 주기는 이러한 일반적인 패턴과는 다를 수 있습니다. 일부 데이터는 초기 수집 후에도 사용되지 않거나 저장된 후 거의 액세스되지 않습니다. 대부분의 장소에는 개인 데이터 및 회계 데이터와 같은 데이터를 저장하는 데 필요한 기간을 규정하는 규정이 있습니다. 특정 국가/지역에서는 송장 수신 및 발신, 현금 장부 잔액, 은행 바우처 및 급여 명세서와 같은 데이터에 대해 5년 동안 기본 문서를 보존해야 할 수 있습니다. 또한 편지, 계약 및 메모와 같은 항목을 포함하는 보조 문서를 3~5년 동안 보존해야 할 수도 있습니다.
데이터 수명 주기 관리
클라우드 규모 분석에서 데이터 수명 주기 관리에 접근하는 방법에는 두 가지가 있습니다.
- Azure Data Lake
같은 지속형 데이터를 포함하는 각 Azure 서비스의 기본 제공 데이터 수명 주기 기능을 사용할 수 있습니다. 이 메서드는 데이터를 콜드 및 보관 계층으로 이동하는 데 적합하지만 지정된 시간 후에 데이터가 삭제되는지 확인하지 못합니다.
Important
보관 계층은 현재 영역 중복 스토리지 계정에 지원되지 않습니다. 자세한 내용은 데이터 중복을 참조하세요.
- 온보딩 프로세스에서 데이터 수명 주기를 통합할 수 있습니다. 이러한 프로세스는 애플리케이션 비즈니스 소유자가 데이터 수명 주기 정책을 정의할 수 있는 기회를 제공합니다. 이 프로세스에는 각 데이터 제품에 대한 메타데이터 표준으로 주요 메트릭을 캡처하는 사용자 지정 애플리케이션이 포함됩니다. 이 메서드의 일부는 데이터를 핫에서 콜드로 이동하여 보관하고 지정된 시간 후에 데이터 삭제를 보장합니다.