为使用分层存储设计策略

已完成

以制造公司为例,你作为项目负责人,第一步是检查可用选项。 然后开始规划贵公司的存储层策略。

在本单元中,将查看 Microsoft Azure 存储层,以及典型用例。 还将查看可以如何使用这些层来帮助管理存储在 Azure blob 中的数据。

Azure 存储

Azure 存储是一款 Microsoft 的托管服务,可提供高可用性的冗余存储。 以下是 Azure 存储的几种类型:

  • Azure Blob:通常用于上传和管理图像、文档以及一般数据
  • Azure 文件:通过它可以使用 Server Message Block (SMB) 3.0 创建文件共享,这样系统就可以通过统一命名约定 (UNC) 路径访问文件
  • Azure Data Lake:通过它可以为大数据分析等任务存储大型复杂数据

本模块全是关于优化 Azure Blob 存储。

Azure Blob

可以使用 blob 将大量非结构化数据(例如文本或二进制数据)存储为单独的文件。 Blob 被组织成容器,因此在存储帐户中可创建的容器数量没有限制。 每个容器都可容纳无限数量的 blob,而且 blob 必须驻留在容器中。

这些容器不支持子目录,但是可以通过向文件名添加 / 来创建逻辑结构。 例如,在容器的顶级中将名为 Report.txt 的文件保存为 /Sales/Report.txt。 对于任何访问文件的服务,都将显示文件保存在名为 Sales 的子目录中。

Blob 存储访问层

Azure 存储提供多个存储层。 每一层的定价都不同,其中性能最好的层成本最高。 配置这些层,可以将数据访问速度和成本之间的平衡点优化到最佳。

目前有四个 Blob 存储层:

  • :这一层是默认层,用于存储访问频率较高的数据。 与冷存储层和存档存储层相比,在这一层存储数据成本更高,但访问成本更低。 “热”支持 99.9% 的可用性 SLA。 可在帐户级别和对象级别设置热存储层。
  • :这一层用于存储访问频率较低的数据,如存档文件、备份以及原始数据或未处理数据。 冷存储层专为可能至少要存储 30 天的数据设计。 按每 GB 计算,“冷”存储的成本低于“热”存储。 具体成本取决于区域。 “冷”支持 99.9% 的可用性 SLA。 可在帐户级别和对象级别设置冷存储层。
  • :此层经过优化,用于存储不经常访问/修改的数据。 寒存储层专为可能至少要存储 90 天的数据设计。 与冷存储层相比,它的存储成本更低,但访问成本更高。 只能在 blob 级别设置寒访问层。
  • 存档:对于存储数据,这是最划算的选择,但是对于数据检索,这通常比其他层的成本更高。 存档存储层专为可能要存储至少 180 天的数据以及可以容忍检索延迟的系统或方案设计。 只能在 blob 级别设置存档访问层。

在帐户级别只能设置“冷”和“热”访问层。

可以使用具有常规用途 V2 存储帐户的“热”、“冷”、“寒”和“存档”存储层。

如果使用模式发生更改,可以随时切换访问层。 各层之间的更改是即时的,但希望将数据移出“存档”时除外。 “存档”数据为离线状态,只有元数据可用于在线查询。 若要访问“存档”数据,必须先对 blob 解除冻结。

Blob 解除冻结

Blob 解除冻结是从存档中检索数据并将其从离线存储移动到在线存储的过程。 数据可以解除冻结,移动回“热”层或“冷”层。 可以将 blob 层从“存档”更改为“热”或“冷”来启动该过程。 此过程可能需要长达 15 个小时的时间。

定价

存储成本取决于所用存储层:

  • 由于数据移出热存储层,而存档存储层成本最低,因此数据的存储成本降低
  • 检索数据的成本越高,冷却层次越低;例如,从“冷”检索数据的成本高于从“热”检索数据的成本。 从“存档”中检索成本最高。
  • 更改存储层也会产生成本。

Azure Blob 存储生命周期管理

Blob 存储生命周期管理允许你使用策略和规则在层之间自动移动数据。 使用策略有助于控制存储性能和成本。

凭借生命周期管理,可以执行以下操作:

  • 将 blob 转换为冷存储层或存档存储层。
  • 删除 blob。

可以创建规则来执行以下操作:

  • 在 X 天后将 blob 移动到冷存储层。
  • 在 X 天后将 blob 移动到存档存储层。
  • 在 X 天后删除 blob。

知识检查

1.

以下哪一项不是有效 blob 存储访问层?

2.

访问层之间将立即发生以下哪些更改?