你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
迁移到 SMB Azure 文件共享
本文介绍了迁移到 SMB Azure 文件共享的基本方面,并包含一个迁移指南表。 这些指南有助于将文件移到 Azure 文件共享。 指南根据数据所在的位置以及你要移动到的部署模型(仅限云的模型或混合模型)进行组织。
适用于
文件共享类型 | SMB | NFS |
---|---|---|
标准文件共享 (GPv2)、LRS/ZRS | ||
标准文件共享 (GPv2)、GRS/GZRS | ||
高级文件共享 (FileStorage)、LRS/ZRS |
迁移基础知识
Azure 提供不同类型的云存储。 文件迁移到 Azure 的一个重要方面是确定哪个 Azure 存储选项适合你的数据。
Azure 文件共享适用于常规用途的文件数据。 此数据包括将本地 SMB 共享用于的任何内容。 通过 Azure 文件同步,可以在本地运行 Windows Server 的服务器上缓存多个 Azure 文件共享的内容。
对于当前在本地服务器上运行的应用,将文件存储在 Azure 文件共享中可能是一个不错的选择。 你可以将应用移到 Azure,并使用 Azure 文件共享作为共享存储。 还可以考虑将 Azure 磁盘 用于此场景。
某些云应用不依赖于 SMB 或计算机本地数据访问/共享访问。 对于这些应用,Azure Blob 之类的对象存储通常是最佳选择。
任何迁移的关键在于,将文件从其当前存储位置移到 Azure 时捕获所有适用的文件保真度。 Azure 存储选项支持的保真度和场景所需的保真度同样有助于选择正确的 Azure 存储。
下面是文件的两个基本组件:
- 数据流:文件的数据流存储文件内容。
- 文件元数据:与 Azure Blob 中的对象存储不同,Azure 文件共享可本机存储文件元数据。 通常,常规用途的文件数据依赖于文件元数据。 应用数据可能不会。 文件元数据具有以下子组件:
- 文件特性,如只读
- 文件权限,通常可称为“NTFS 权限”或“文件和文件夹 ACL”
- 时间戳,最值得注意的是创建时间戳和上次修改时间戳
- 备用数据流,用于存储更多非标准属性的空间。 此备用数据流无法存储在 Azure 文件共享的文件中。 它将在使用 Azure 文件同步时,保留在本地。
可以将迁移中的文件保真度定义为能够执行以下操作的能力:
- 将所有适用的文件信息存储在源上。
- 通过迁移工具传输文件。
- 将文件存储在迁移的目标存储中。
本文中迁移指南的目标是一个或多个 Azure 文件共享。 请考虑这个 SMB Azure 文件共享不支持的功能列表。
若要确保迁移顺利进行,请根据需要确定最佳复制工具,并将存储目标与源相匹配。
重要
如果要将本地文件服务器迁移到 Azure 文件存储,请在复制大量文件之前为文件共享的根目录设置 ACL,因为如果在大型文件迁移后执行此操作,对根 ACL 的权限变更可能需要花费很长时间进行传播。
利用 Active Directory 域服务 (AD DS) 作为本地域控制器的用户可以以本机方式访问 Azure 文件共享。 Microsoft Entra 域服务的用户也可以这样做。 二者都可使用其当前标识,基于共享权限以及文件和文件夹 ACL 来获取访问权限。 此行为类似于连接到本地文件共享的用户。
详细了解如何通过 SMB 对 Azure 文件存储进行基于标识的身份验证。
支持的元数据
下表列出了 Azure 文件存储支持的元数据。
重要
目前,目标共享上的文件或目录不支持 LastAccessTime 时间戳。 但是,Azure 文件存储会在收到请求时返回文件的 LastAccessTime 值。 由于在执行读取操作时不会更新 LastAccessTime 时间戳,因此它将始终等于 LastModifiedTime。
Source | Target |
---|---|
目录结构 | 源的原始目录结构可以保留在目标共享上。 |
符号链接 | 源上的符号链接可以保留并映射到目标共享上。 |
访问权限 | Azure 文件存储支持 Windows ACL,即使在迁移时未配置 AD 集成,也必须在目标共享上设置 Windows ACL。 必须保留以下 ACL:所有者安全标识符 (SID)、组 SID、随机访问控制列表 (DACL)、系统访问控制列表 (SACL)。 |
创建时间戳 | 源文件的原始创建时间戳可以保留在目标共享上。 |
更改时间戳 | 源文件的原始更改时间戳可以保留在目标共享上。 |
修改时间戳 | 源文件的原始修改时间戳可以保留在目标共享上。 |
文件属性 | 只读、隐藏和存档标志等常见属性可以保留在目标共享上。 |
迁移指南
下表列出了用于迁移到 SMB Azure 文件共享的建议工具组合。
如何使用该表:
找到当前存储文件的源系统的行。
选择以下目标之一:
- 混合部署:使用 Azure 文件同步在本地缓存 Azure 文件共享内容,并将不太常用的文件分层到云中。
- 仅限云的部署:云端的 Azure 文件共享,无需本地缓存。
选择与你的选择相匹配的目标列。
在源和目标的交集内,表单元格列出可用的迁移场景。 选择一个以直接链接到迁移指南。
没有链接的场景目前还没有发布的迁移指南。 偶尔检查此表中是否有更新。 新指南出台后将会发布。
Source | 目标: 混合部署 (Azure 文件存储 + Azure 文件同步) |
目标: 纯云部署 (Azure 文件存储) |
---|---|---|
建议的工具组合: | 建议的工具组合: | |
Windows Server 2012 R2 和更高版本 |
|
|
Windows Server 2012 和更低版本 |
|
|
网络连接存储 (NAS) |
|
|
Linux (SMB) |
|
|
迁移工具箱
文件复制工具
Microsoft 和其他公司提供了几种文件复制工具。 若要为迁移方案选择合适的工具,请考虑以下基本问题:
该工具是否支持文件复制的源位置和目标位置?
该工具是否支持源存储位置和目标存储位置之间的网络路径或可用协议(例如 REST 或 SMB)?
该工具是否保留源位置和目标位置支持的必要文件保真度?
在某些情况下,目标存储不支持与源相同的保真度。 如果目标存储足以满足你的需求,则该工具只必须匹配目标的文件保真功能。
该工具是否具有可使其适应你的迁移策略的功能?
例如,考虑该工具是否可以最大程度地减少停机时间。
当某个工具支持将源镜像到目标的选项时,通常可以在同一源和目标上多次运行该工具,而源仍可访问。
首次运行该工具时,它会复制大量数据。 此初始运行可能会持续一段时间。 它持续的时间通常比使业务流程的数据源脱机所需的时间长。
通过将源镜像到目标(与使用 robocopy/MIR 一样),可以在该相同源和目标上再次运行该工具。 这第二个运行的速度要快得多,因为它只需要传输在上次运行后发生的源更改。 通过这种方式重新运行复制工具可显著减少停机时间。
下表对 Microsoft 工具及其当前对 SMB Azure 文件共享的适用性进行了分类:
建议 | 工具 | 对 Azure 文件共享的支持 | 对文件保真度的保留 |
---|---|---|---|
Azure 存储移动程序 | 受支持。 | 完全保真。* | |
RoboCopy | 支持。 可以将 Azure 文件共享装载为网络驱动器。 | 完全保真。* | |
Azure 文件同步 | 以本机方式集成到 Azure 文件共享中。 | 完全保真。* | |
Azure 存储迁移计划 | 受支持。 | 完全保真。* | |
存储迁移服务 | 间接支持。 可以在 SMS 目标服务器上将 Azure 文件共享装载为网络驱动器。 | 完全保真。* | |
Data Box(包括数据复制服务,用于将文件加载到设备) | 受支持。 (Data Box Disk 不支持大型文件共享) |
Data Box 和 Data Box Heavy 完全支持元数据。 Data Box Disk 不保留文件元数据。 |
|
AzCopy 最新版本 |
支持,但不完全建议这样做。 | 不支持大规模差异复制,某些文件保真度可能会丢失。 了解如何将 AzCopy 与 Azure 文件共享配合使用 |
|
Azure 存储资源管理器 最新版本 |
支持,但不建议这样做。 | 丢失大部分文件保真度,如 ACL。 支持时间戳。 | |
Azure 数据工厂 | 支持。 | 不复制元数据。 | |
* 完全保真:达到或超过 Azure 文件共享功能。
迁移帮助程序工具
本部分介绍有助于计划和运行迁移的工具。
Azure 存储移动程序
Azure 存储移动程序是一种相对较新的、完全托管的迁移服务,用于将文件和文件夹迁移到 SMB Azure 文件共享,具有与基础 Azure 文件共享相同的文件保真度。 维护文件夹结构和元数据值,例如文件和文件夹时间戳、ACL 和文件属性。 若要了解如何将 Azure 存储移动程序与 Azure 文件存储一起使用,请参阅使用 Azure 存储移动程序迁移到 SMB Azure 文件共享。
RoboCopy
RoboCopy 包含在 Windows 中,它是最适合 SMB 文件迁移的工具之一。 对于此工具的众多选项,主要的 RoboCopy 文档是一个有用的资源。
Azure 存储迁移计划
了解数据是选择合适的 Azure 存储服务和迁移策略的第一步。 Azure 存储迁移计划提供了不同的工具,可以分析数据和存储基础结构以提供有价值的见解。 这些工具可以帮助你了解数据的大小和类型、文件和文件夹计数以及访问模式。 它们提供数据的综合视图并支持创建各种自定义报表。
此信息有助于:
- 识别重复和冗余的数据集
- 识别可以转移到更便宜的存储的较冷数据
若要了解详细信息,请参阅 Azure 存储迁移计划参与者的比较矩阵。
JAM Software GmbH 的 TreeSize
Azure 文件同步主要随项(文件和文件夹)的数量而非总存储量而缩放。 通过 TreeSize 工具,可确定 Windows Server 卷上的项数。
可以使用该工具在 Azure 文件同步部署之前创建透视。 部署后启用云分层时,也可以使用它。 在这种场景下,可以看到项数以及哪些目录使用服务器缓存最多。
该工具的测试版本为 4.4.1。 它与云分层文件兼容。 该工具在正常运行期间不会导致分层文件的重调。
后续步骤
- 为所需的 Azure 文件共享的部署(仅限云的部署或混合部署)创建一个计划。
- 查看可用迁移指南列表,以查找与 Azure 文件共享的源和部署匹配的指南。
关于本文中提到的 Azure 文件存储技术的详细信息: