你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
教程:通过 SMB 将数据复制到 Azure Data Box Heavy
将数据复制到 Azure Data Box Heavy
重要
Azure Data Box 现在支持 blob 级别的访问层分配。 本教程中包含的步骤反映了更新的数据复制过程,且专门针对块 blob。
本部分中包含的信息适用于在 2024 年 4 月 1 日之后下达的订单。
本教程介绍如何使用本地 Web UI 连接到主机并从中复制数据。
在本教程中,你将了解如何执行以下操作:
- 连接到 Data Box Heavy
- 将数据复制到 Data Box Heavy
可以通过 SMB、NFS、REST、数据复制服务将数据从源服务器复制到 Data Box 或托管磁盘。
在每种情况下,请确保共享名称、文件夹名称以及数据大小遵循 Azure 存储和 Data Box Heavy 服务限制中所述的准则。
先决条件
在开始之前,请确保:
- 完成教程:设置 Azure Data Box Heavy。
- 你收到 Data Box Heavy,并且门户中的订单状态为“已送达”。
- 你有一台主机,其中的数据需复制到 Data Box Heavy。 该主机必须:
- 运行支持的操作系统。
- 连接到高速网络。 为获得最快的复制速度,可以同时利用两个 40-GbE 连接(在每个节点上使用一个)。 如果没有可用的 40-GbE 连接,我们建议至少开通两个 10-GbE 连接(在每个节点上使用一个)。
连接到 Data Box Heavy 共享
根据选择的存储帐户,Data Box Heavy 将会:
- 为每个关联的 GPv1 和 GPv2 存储帐户最多创建三个共享。
- 用于高级存储的一个共享。
- 一个共享(针对一个 Blob 存储帐户),其中包含四个文件夹,分别用于四个访问层。
下表中确定了可连接到的 Data Box 共享的名称,以及上传到目标存储帐户的数据类型。 它还确定了将源数据复制到其中的共享和目录的层次结构。
存储类型 | 共享名 | 第一级实体 | 第二级实体 | 第三级实体 |
---|---|---|---|---|
块 blob | <storageAccountName>_BlockBlob | <\accessTier> | <\containerName> | <\blockBlob> |
页 blob | <\storageAccountName>_PageBlob | <\containerName> | <\pageBlob> | |
文件存储 | <\storageAccountName>_AzFile | <\fileShareName> | <\file> |
不能将文件直接复制到任何 Data Box 共享的根文件夹中。 请改为根据用例在 Data Box 共享中创建文件夹。
块 Blob 支持在文件级别分配访问层。 将文件复制到块 Blob 共享时,建议的最佳做法是在适当的访问层中添加新的子文件夹。 创建新的子文件夹后,请根据需要继续向每个子文件夹添加文件。
为驻留在块 Blob 共享根目录中的任何文件夹创建一个新容器。 该文件夹中的任何文件都作为块 Blob 复制到存储帐户的默认访问层。
有关 Blob 访问层的详细信息,请参阅 Blob 数据的访问层。 如需详细了解访问层的最佳做法,请参阅有关使用 blob 访问层的最佳做法。
下表显示了 Data Box 上共享的 UNC 路径,以及数据上传到的相应 Azure 存储路径 URL。 最终的 Azure 存储路径 URL 可以从 UNC 共享路径派生。
Azure 存储类型 | Data Box 共享 |
---|---|
Azure 块 Blob | \\<DeviceIPAddress>\<storageaccountname_BlockBlob>\<accessTier>\<ContainerName>\myBlob.txt https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.txt |
Azure 页 Blob | \\<DeviceIPAddress>\<storageaccountname_PageBlob>\<ContainerName>\myBlob.vhd https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.vhd |
Azure 文件 | \\<DeviceIPAddress>\<storageaccountname_AzFile>\<ShareName>\myFile.txt https://<storageaccountname>.file.core.windows.net/<ShareName>/myFile.txt |
有关 Blob 访问层的详细信息,请参阅 Blob 数据的访问层。 如需详细了解访问层的最佳做法,请参阅有关使用 blob 访问层的最佳做法。
使用 Windows 或 Linux 客户端进行连接的步骤是不相同的。
注意
请遵循相同的步骤同时连接到设备的两个节点。
在 Windows 系统上进行连接
如果使用 Windows Server 主机,请遵循以下步骤连接到 Data Box Heavy。
第一步是进行身份验证并启动会话。 转到“连接和复制”。 单击“获取凭据”,获取与存储帐户关联的共享的访问凭据。
在“访问共享和复制数据”对话框中,复制对应于该共享的“用户名”和“密码”。 单击“确定”。
若要从主机访问与存储帐户关联的共享(在以下示例中为 databoxe2etest),请打开命令窗口。 在命令提示符处,键入:
net use \\<IP address of the device>\<share name> /u:<user name for the share>
根据数据格式,共享路径如下:
- Azure 块 blob -
\\10.100.10.100\databoxe2etest_BlockBlob
- Azure 页 blob -
\\10.100.10.100\databoxe2etest_PageBlob
- Azure 文件 -
\\10.100.10.100\databoxe2etest_AzFile
- Azure 块 blob -
出现提示时,请输入共享的密码。 以下示例可用于连接到 IP 地址为 10.100.10.100 的 Data Box 上的 BlockBlob 共享。
net use \\10.100.10.100\databoxe2etest_BlockBlob /u:databoxe2etest Enter the password for 'databoxe2etest' to connect to '10.100.10.100': The command completed successfully.
按 Windows+R。在“运行”窗口中指定
\\<device IP address>
。 单击“确定”打开文件资源管理器 。此时应能看到文件夹形式的共享。 请注意,在此示例中使用的是 BlockBlob 共享。 因此,存在代表四个可用访问层的四个文件夹。 这些文件夹在其他共享中不可用。
始终为要复制到共享下的文件创建一个文件夹,然后将文件复制到该文件夹。 无法将文件直接复制到存储帐户中的 root 文件夹。 在 PageBlob 共享下创建的任何文件夹都表示容器,数据以 blob 形式上传到其中。 同样,在表示 BlockBlob 共享中的访问层的文件夹中创建的任何子文件夹也表示 blob 存储容器。 在 AzFile 共享中创建的文件夹代表文件共享。
在 BlockBlob 共享的根处创建的文件夹会被创建为 blob 容器。 这些容器的访问层将从存储帐户继承。
在 Linux 系统上进行连接
如果使用 Linux 客户端,请使用以下命令装载 SMB 共享。
sudo mount -t nfs -o vers=2.1 10.126.76.172:/databoxe2etest_BlockBlob /home/databoxubuntuhost/databox
vers
参数是 Linux 主机支持的 SMB 版本。 请在以上命令中插入相应的版本。
有关 Data Box Heavy 支持的 SMB 版本,请参阅 Linux 客户端支持的文件系统。
将数据复制到 Data Box Heavy
连接到 Data Box Heavy 共享后,下一步是复制数据。
复制注意事项
在开始复制数据之前,请查看以下注意事项:
确保将数据复制到与适当数据格式对应的共享中。 例如,将块 Blob 数据复制到块 Blob 的共享中。 将 VHD 复制到页 Blob。
如果数据格式与相应的共享类型不匹配,则在后续步骤中,数据将无法上传到 Azure。
复制数据时,请确保数据大小符合 Azure 存储和 Data Box Heavy 限制中所述的大小限制。
如果 Data Box Heavy 正在上传的数据同时已由 Data Box Heavy 外部的其他应用程序上传,则可能会导致上传作业失败和数据损坏。
我们建议:
- 不同时使用 SMB 和 NFS。
- 将相同的数据复制到 Azure 上的同一个最终目标。
在这些情况下,最终的结果不可确定。
始终为要复制到共享下的文件创建一个文件夹,然后将文件复制到该文件夹。 在块 blob 和页 blob 共享下创建的文件夹表示将数据作为 blob 上传到的容器。 无法将文件直接复制到存储帐户中的 root 文件夹。
连接到 SMB 共享后,开始数据复制。
可以使用与 SMB 兼容的任何文件复制工具(例如 Robocopy)复制数据。 可以使用 Robocopy 启动多个复制作业。 请使用以下命令:
robocopy <Source> <Target> * /e /r:3 /w:60 /is /nfl /ndl /np /MT:32 or 64 /fft /Log+:<LogFile>
下表描述了属性。
Attribute 说明 /e 复制包括空目录的子目录。 /r: 指定复制失败时的重试次数。 /w: 指定等待重试的间隔时间,以秒为单位。 /is 包括相同的文件。 /nfl 指定不记录文件名。 /ndl 指定不记录目录名。 /np 指定不要显示复制操作的进度(到目前为止复制的文件或目录数)。 显示进度会明显降低性能。 /MT 使用多线程,建议使用 32 或 64 个线程。 不要对加密的文件使用此选项。 可能需要将加密和未加密的文件隔离开来。 但是,单线程复制会明显降低性能。 /fft 用于减少任何文件系统的时间戳粒度。 /b 在备份模式下复制文件。 /z 在重启模式下复制文件,如果环境不稳定,请使用此选项。 由于日志记录量增加,此选项会降低吞吐量。 /zb 使用重启模式。 如果访问被拒绝,此选项将使用备份模式。 由于要设置检查点,此选项会降低吞吐量。 /efsraw 在 EFS 原始模式下复制所有加密的文件。 请仅对加密的文件使用此选项。 log+:<LogFile> 将输出追加到现有的日志文件。 以下示例显示了将文件复制到 Data Box Heavy 磁盘的 robocopy 命令的输出。
C:\Users>Robocopy C:\Git\azure-docs-pr\contributor-guide \\10.100.10.100\devicemanagertest1_AzFile\templates /MT:24 ------------------------------------------------------------------------------- ROBOCOPY :: Robust File Copy for Windows ------------------------------------------------------------------------------- Started : Thursday, April 4, 2019 2:34:58 PM Source : C:\Git\azure-docs-pr\contributor-guide\ Dest : \\10.100.10.100\devicemanagertest1_AzFile\templates\ Files : *.* Options : *.* /DCOPY:DA /COPY:DAT /MT:24 /R:5 /W:60 ------------------------------------------------------------------------------ 100% New File 206 C:\Git\azure-docs-pr\contributor-guide\article-metadata.md 100% New File 209 C:\Git\azure-docs-pr\contributor-guide\content-channel-guidance.md 100% New File 732 C:\Git\azure-docs-pr\contributor-guide\contributor-guide-index.md 100% New File 199 C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pr-criteria.md New File 178 C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pull-request-co100% .md New File 250 C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pull-request-et100% e.md 100% New File 174 C:\Git\azure-docs-pr\contributor-guide\create-images-markdown.md 100% New File 197 C:\Git\azure-docs-pr\contributor-guide\create-links-markdown.md 100% New File 184 C:\Git\azure-docs-pr\contributor-guide\create-tables-markdown.md 100% New File 208 C:\Git\azure-docs-pr\contributor-guide\custom-markdown-extensions.md 100% New File 210 C:\Git\azure-docs-pr\contributor-guide\file-names-and-locations.md 100% New File 234 C:\Git\azure-docs-pr\contributor-guide\git-commands-for-master.md 100% New File 186 C:\Git\azure-docs-pr\contributor-guide\release-branches.md 100% New File 240 C:\Git\azure-docs-pr\contributor-guide\retire-or-rename-an-article.md 100% New File 215 C:\Git\azure-docs-pr\contributor-guide\style-and-voice.md 100% New File 212 C:\Git\azure-docs-pr\contributor-guide\syntax-highlighting-markdown.md 100% New File 207 C:\Git\azure-docs-pr\contributor-guide\tools-and-setup.md ------------------------------------------------------------------------------ Total Copied Skipped Mismatch FAILED Extras Dirs : 1 1 1 0 0 0 Files : 17 17 0 0 0 0 Bytes : 3.9 k 3.9 k 0 0 0 0 C:\Users>
若要优化性能,请在复制数据时使用以下 robocopy 参数。 (以下数字是最有利的。)
平台 大多为小于 512 KB 的小型文件 大多为 512 KB-1 MB 的中型文件 大多为 1 MB 以上的大型文件 Data Box Heavy 6 个 Robocopy 会话
每个会话 24 个线程6 个 Robocopy 会话
每个会话 16 个线程6 个 Robocopy 会话
每个会话 16 个线程有关 Robocopy 命令的详细信息,请转到 Robocopy 和几个示例。
打开目标文件夹,查看并验证复制的文件。
复制数据时:
- 将验证文件名、大小和格式,以确保符合 Azure 对象和存储限制以及 Azure 文件和容器命名约定。
- 为确保数据完整性,还将以内联方式计算校验和。
如果复制过程中遇到任何错误,请下载用于故障排除的错误文件。 选择箭头图标下载错误文件。
有关详细信息,请参阅查看将数据复制到 Data Box Heavy 期间生成的错误日志。 有关数据复制期间的错误详细列表,请参阅排查 Data Box Heavy 问题。
在记事本中打开错误文件。 以下错误文件指示数据未正确对齐。
对于页 Blob,数据需要经过 512 字节对齐。 删除此数据后,错误会得到解决,如以下屏幕截图中所示。
复制完成后,转到“查看仪表板”页。 检查设备上的已用空间和可用空间。
重复上述步骤,将数据复制到设备的第二个节点。
后续步骤
本教程介绍了 Azure Data Box Heavy 主题,例如:
- 连接到 Data Box Heavy
- 将数据复制到 Data Box Heavy
请继续学习下一篇教程,了解如何将 Data Box Heavy 寄回 Microsoft。
通过 SMB 复制数据
如果使用 Windows 主机,请使用以下命令连接到 SMB 共享:
\\<IP address of your device>\ShareName
若要获取共享访问凭据,请在 Data Box 的本地 Web UI 中转到“连接和复制”页面。
使用与 SMB 兼容的文件复制工具(如 Robocopy)将数据复制到共享。
有关分步说明,请转至教程:通过 SMB 将数据复制到 Azure Data Box。
通过 NFS 复制数据
如果使用 NFS 主机,请使用以下命令装载 NFS 共享:
sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>
若要获取共享访问凭据,请在 Data Box Heavy 的本地 Web UI 中转到“连接和复制”页。
使用
cp
或rsync
命令复制数据。重复上述步骤,将数据连接并复制到 Data Box Heavy 的第二个节点。
有关分步说明,请转至教程:通过 NFS 将数据复制到 Azure Data Box。
通过 REST 复制数据
- 若要通过 REST API 使用 Data Box Blob 存储复制数据,可以通过 http 或 https 进行连接。
- 若要将数据复制到 Data Box Blob 存储,可以使用 AzCopy。
- 重复上述步骤,将数据连接并复制到 Data Box Heavy 的第二个节点。
有关分步说明,请转至教程:通过 REST API 将数据复制到 Azure Data Box Blob 存储。
通过数据复制服务复制数据
- 若要使用数据复制服务复制数据,需要创建一个作业。 在 Data Box Heavy 的本地 Web UI 中,转到“管理”>“复制数据”>“创建”。
- 填写参数并创建作业。
- 重复上述步骤,将数据连接并复制到 Data Box Heavy 的第二个节点。
有关分步说明,请转至教程:使用数据复制服务将数据复制到 Azure Data Box Heavy。
将数据复制到托管磁盘
- 订购 Data Box Heavy 设备时,应该选择托管磁盘作为存储目标。
- 可以通过 SMB 或 NFS 共享连接到 Data Box Heavy。
- 然后,可以通过 SMB 或 NFS 工具复制数据。
- 重复上述步骤,将数据连接并复制到 Data Box Heavy 的第二个节点。
有关分步说明,请转至教程:使用 Data Box Heavy 将数据导入为 Azure 中的托管磁盘。