数据重复删除概述
什么是重复数据删除?
重复数据删除(通常简称为删除重复)是一项功能,可以帮助减少冗余数据对存储成本的影响。 启用后,重复数据删除会检查卷上的数据(检查是否存在重复分区),优化卷上的可用空间。 卷数据集的重复分区只存储一次,并可以压缩,节省更多空间。 重复数据删除可优化冗余,而不会损坏数据保真度或完整性。 若要详细了解重复数据删除的工作原理,请参阅“重复数据删除是如何工作的?”部分, 位于了解重复数据删除页面。
重要
KB4025334 包含重复数据删除的修补程序汇总(包括重要的可靠性修补程序),我们强烈建议在将重复数据删除与 Windows Server 2016 和 Windows Server 2019 配合使用时安装该修补程序。
重复数据删除为什么有用?
重复数据删除可帮助存储管理员降低重复数据的相关成本。 大型数据集通常具有大量重复数据,这会增加存储数据的成本。 例如:
- 用户文件共享可能会有相同或类似文件的多个副本。
- 不同 VM 的虚拟化来宾可能几乎完全相同。
- 每天的备份快照差别可能非常小。
通过重复数据删除可以节省的空间取决于卷上的数据集或工作负荷。 重复率很高的数据集的优化率最高可达 95%,存储使用率最高降低 20 倍。 下表主要显示了各种内容类型的典型的重复数据删除节省情况:
方案 | 内容 | 典型的空间节省率 |
---|---|---|
用户文档 | Office 文档、照片、音乐、视频等 | 30-50% |
部署共享 | 软件二进制文件、cab 文件、符号等 | 70-80% |
虚拟化库 | ISO、虚拟硬盘文件等 | 80-95% |
通用文件共享 | 以上都是 | 50-60% |
注意
如果你只是想释放卷的空间,请考虑使用启用了云分层的 Azure 文件同步。 这样,你便可以在本地缓存最常访问的文件,并将不经常访问的文件分层到云中,从而节省本地存储空间,同时保持性能。 有关详细信息,请参阅规划 Azure 文件同步部署。
何时可以使用重复数据删除?
场景示意图 | 说明 |
---|---|
常规用途文件服务器:常规用途文件服务器是常规使用的文件服务器,可能包含以下任意共享类型:
|
|
虚拟桌面基础结构 (VDI) 部署:VDI 服务器(如远程桌面服务)为组织提供了一种向用户预配桌面的轻型选项。 对于一个组织而言,有很多原因要依赖于此类技术:
|
|
备份目标(如虚拟化备份应用程序):备份应用程序(如 Microsoft Data Protection Manager [DPM])是重复数据删除的理想选择,因为备份快照之间存在大量重复。 | |
其他工作负载:其他工作负载也可能是重复数据删除的理想选择。 |