你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
数据生命周期管理
数据生命周期管理是使用特定策略来有效管理系统中存在的整个时间的数据的做法。 这些策略应包括可驱动数据管理过程的总体存储和数据策略。 由于业务目标和驱动因素决定数据生命周期管理策略,因此它们通常与总体 IT 治理、管理和服务级别协议(SLA)的框架联系在一起。
了解你拥有的数据类型及其使用方式后,你已经知道其最有可能的演变和命运。 你需要了解数据的发展方式、确定其增长方式、监视其使用情况随时间的变化、决定其应存在多长时间,以及遵守适用于该数据的所有规则和法规。
数据生命周期管理使用流程、策略和软件的组合来解决这些需求,以便团队可以对数据生命周期的每个阶段使用适当的技术。
数据的生命周期
数据产品可能有不同的生命周期。 在典型的生命周期模式中,新引入的数据经常被使用和访问。 随着时间的推移,其访问率通常会下降,较旧的数据会出现使用率急剧下降的情况。 某些数据产品可能在创建后几天或几个月过期,而另一些数据产品在其整个生存期内都被频繁使用和修改。
不过,数据生命周期可能与这种典型模式不同。 某些数据在初始导入后仍未使用,或者在存储后很少被访问。 大多数地方都规定了数据(如个人数据和会计数据)必须存储的时长。 某些国家/地区可能要求您保留关于传入和传出发票、现金簿余额、银行凭证和工资单等数据的主要文件长达五年。 它还可能需要将辅助文档保留三到五年,其中包括信件、协议和笔记等内容。
管理数据生命周期
可通过两种方法在云规模分析中实现数据生命周期管理:
- 可以使用包含持久化数据的每个 Azure 服务的内置数据生命周期功能,例如 Azure Data Lake。 此方法适用于将数据移到冷层和存档层,但无法确保数据在指定的时间量后被删除。
重要
区域冗余存储帐户当前不支持存档层。 有关详细信息,请参阅数据冗余。
- 可以在加入过程中集成数据生命周期,使应用程序业务所有者有机会定义其数据生命周期策略。 此过程涉及一个自定义应用程序,用于将关键指标捕获到每个数据产品的元数据标准中。 此方法的一部分涉及将数据从热层移到冷层再移到存档层,并确保在指定时间过后删除数据。