データ ライフサイクル管理
データ ライフサイクル管理は、特定のポリシーを使用して、システム内に存在するデータ全体を効果的に管理する方法です。 これらのポリシーは、データ管理プロセスを推進する包括的なストレージ ポリシーとデータ ポリシーで構成されている必要があります。 ビジネス目標とドライバーはデータ ライフサイクル管理ポリシーを規定するため、一般に、全体的な IT ガバナンス、管理、サービス レベル アグリーメント (SLA) のフレームワークに結び付けられます。
あなたが持っているデータの種類と使用方法を知った後、あなたはすでにその最も可能性の高い進化と運命を知っています。 データの進化を理解し、データの成長方法を決定し、時間の経過に伴う使用状況の変化を監視し、存在する必要がある期間を決定し、そのデータに適用されるすべての規則と規制に従う必要があります。
データ ライフサイクル管理は、プロセス、ポリシー、ソフトウェアを組み合わせて使用することにより、これらのニーズに対処し、管理者のチームがデータのライフサイクルの各フェーズに適切なテクノロジを使用できるようにします。
データのライフサイクル
データ製品によって、ライフサイクルが異なる場合があります。 一般的なライフサイクル パターンでは、新しく取り込まれたデータが頻繁に使用およびアクセスされます。 時間がたつにつれて、データへのアクセス頻度は低下することが多く、古くなったデータは使用頻度が激減します。 データ製品の中には、作成後数日または数か月で期限切れになる可能性のあるものもあります。一方、データの有効期間全体にわたってアクティブに使用および変更されるデータ製品もあります。
とはいえ、データのライフサイクルがこの一般的なパターンとは異なる場合もあります。 一部のデータは、最初の取り込み後も使用されず、格納された後もほとんどアクセスされません。 ほとんどの場所には、個人データや会計データなどのデータを保存しておく必要がある期間を規定する規制があります。 特定の国/地域では、請求書の受信と送信、現金帳の残高、銀行の伝票、給与明細などのデータについて、プライマリ ドキュメントを 5 年間保持することが必要になる場合があります。 また、手紙、契約、メモなどを含む 3 年から 5 年間、セカンダリ ドキュメントを保持する必要がある場合もあります。
データ ライフサイクルの管理
クラウド規模の分析でデータ ライフサイクル管理にアプローチするには、次の 2 つの方法があります。
- Azure Data Lakeなど、永続化されたデータを含む各 Azure サービスの組み込みのデータ ライフサイクル機能を使用できます。 この方法は、データをコールド層とアーカイブ層に移動する場合に適していますが、指定した時間が経過するとデータが確実に削除されません。
重要
Archive レベルは、ゾーン冗長ストレージ アカウントでは現在サポートされていません。 詳細については、データの冗長性に関する記事を参照してください。
- データ ライフサイクルをオンボード プロセスに統合できます。このようにすると、アプリケーションのビジネス所有者に対して、データ ライフサイクル ポリシーを定義する機会を提供できます。 このプロセスには、各データ製品のメタデータ標準に主要なメトリックをキャプチャするカスタム アプリケーションが含まれます。 この方法の一部では、データをホットからコールドに移動してアーカイブし、指定した時間が経過した後にデータが確実に削除されるようにします。