共用方式為


教學課程:使用資料複製服務將資料複製到 Azure Data Box Heavy (預覽)

本教學課程說明如何使用資料複製服務擷取資料,而不需要中繼主機。 資料複製服務會在 Azure Data Box Heavy 本機上執行、透過 SMB 連線到您的網路連接儲存裝置 (NAS) 裝置,以及將資料複製到 Data Box Heavy。

使用資料複製服務:

  • 在可能無法使用中繼主機的 NAS 環境中使用。
  • 搭配需要數週時間來擷取和上傳資料的小型檔案。 資料複製服務可大幅改善小型檔案的擷取和上傳時間。

在本教學課程中,您會了解如何:

  • 將資料複製到 Data Box Heavy

必要條件

在您開始前,請確定:

  1. 您已完成教學課程:設定 Azure Data Box Heavy
  2. 您已收到 Data Box Heavy,且入口網站中的訂購狀態為 [已交付]
  3. 您有欲連線來源 NAS 裝置的認證可供資料複製使用。
  4. 您已連線至高速網路。 如需最快的複製速度,可平行使用兩個 40 GbE 的連線 (每個節點一個連線)。 如果您沒有 40 GbE 連線可用,我們建議您至少有兩個 10 GbE 的連線 (每個節點一個連線)。

將資料複製到 Data Box Heavy

在連線至 NAS 裝置後,下一個步驟是複製資料。 開始複製資料之前,請檢閱下列注意事項:

  • 複製資料時,請確定資料大小符合 Azure 儲存體和 Data Box Heavy 限制一文中所述的大小限制。
  • 如果由 Data Box Heavy 上傳的資料同時由 Data Box Heavy 外部的其他應用程式上傳,則可能導致上傳作業失敗和資料損毀。
  • 如果資料因為由資料複製服務讀取而有所修改,您可能會看到資料失敗或損毀。

若要使用資料複製服務來複製資料,您需要建立一項作業:

  1. 在 Data Box Heavy 裝置的本機 Web UI 中,移至 [管理]>[複製資料]

  2. 在 [複製資料] 頁面上,選取 [建立]

    Select Create on the

  3. 在 [設定作業並啟動] 對話方塊中,填寫下列欄位:

    欄位
    作業名稱 作業的唯一名稱超過 230 個字元。 作業名稱中不允許以下字元:<、>、|、?、*、\、:、/ 和 \。
    來源位置 以下列格式提供資料來源的 SMB 路徑:\\<ServerIPAddress>\<ShareName>\\<ServerName>\<ShareName>
    使用者名稱 用以存取資料來源的使用者名稱 (採用 \\<DomainName><UserName> 格式)。 如果本機系統管理員正在連線,他們需要明確的安全性權限。 以滑鼠右鍵按一下資料夾,選取 [屬性],然後選取 [安全性]。 這樣應該會在 [安全性] 索引標籤中新增本機系統管理員。
    密碼 用以存取資料來源的密碼。
    目的地儲存體帳戶 從清單中選取要作為資料上傳目的地的儲存體帳戶。
    目的地類型 從清單中選取目標儲存體類型:區塊 Blob分頁 BlobAzure 檔案儲存體
    目的地容器/共用 輸入位於目的地儲存體帳戶中,要作為資料上傳目的地容器或共用的名稱。 此名稱可以是共用名稱或容器名稱。 例如,使用 mysharemycontainer。 您也可以使用 sharename\directory_namecontainername\virtual_directory_name 格式來輸入名稱。
    複製符合模式的檔案 您可以利用下列兩種方式來輸入檔案名稱比對模式:
    • 使用萬用字元運算式:萬用字元運算式僅支援 *?。 例如,*.vhd 運算式會比對所有具有 .vhd 副檔名的檔案。 同樣地,*.dl? 會使用 .dl 副檔名或開頭為 .dl 的副檔名 (例如,.dll) 來比對所有檔案。 同樣地,*foo 會比對其名稱結尾為 foo 的所有檔案。
      您可以在欄位中直接輸入萬用字元運算式。 根據預設,系統會將此欄位中的輸入值視為萬用字元運算式。
    • 使用規則運算式:支援 POSIX 型規則運算式。 例如,規則運算式 .*\.vhd 會比對具有 .vhd 副檔名的所有檔案。 針對規則運算式,直接提供 <pattern> 作為 regex(<pattern>)。 如需有關規則運算式的詳細資訊,請移至規則運算式語言 - 快速參考
      檔案最佳化 這項功能啟用時,系統會在擷取期間封裝小於 1 MB 的檔案。 此封裝動作可加快小型檔案的資料複製作業。 此外,當檔案數目遠遠超過目錄數目時,亦可省下不少時間。
    • 選取 [開始]。 系統會驗證輸入的內容,如果驗證成功,便會啟動作業。 系統可能需要花幾分鐘的時間才能讓作業啟動。

      Start a job from the

    • 使用指定的設定來建立作業。 您可以暫停、繼續、取消或重新啟動作業。 選取作業名稱旁的核取方塊,然後選取適當按鈕。

      Manage a job on the

      • 如果作業在尖峰時段會影響 NAS 裝置的資源,您可以將其暫停:

        Pause a job on the

        稍後,您可以在非尖峰時段繼續作業:

        Resume a job on the

      • 您可以隨時取消作業:

        Cancel a job on the

        取消作業時必須進行確認:

        Confirm job cancellation

        如果您決定要取消作業,已經複製的資料並不會遭到刪除。 若要刪除您已複製到資料箱裝置的資料,請重設裝置。

        Reset a device

        注意

        如果您取消或暫停作業,大型檔案可能只複製了一部分。 這些部分複製的檔案會以相同的狀態上傳至 Azure。 當您取消或暫停作業時,請確定檔案是否已徹底複製完成。 若要驗證檔案,請查看 SMB 共用或下載 BOM 檔案。

      • 如果作業因為暫時性錯誤 (例如網路故障) 而失敗,您可以重新啟動作業。 但如果作業已達到終端狀態 (例如,成功完成但發生錯誤),您就無法重新啟動作業。 作業失敗可能是檔案命名或檔案大小的問題所造成。 系統會記錄這些錯誤,但作業在完成後就無法重新啟動。

        Restart a failed job

        如果您遇到失敗且無法重新啟動作業,請下載錯誤記錄並在記錄檔中查看該項失敗。 在更正問題後,請建立新的作業來複製檔案。 您也可以透過 SMB 複製檔案

      • 在這個版本中,您無法刪除作業。

      • 您可以建立的作業數量沒有限制,但一次最多只能平行執行 10 個作業。

      • 若已開啟檔案最佳化,系統便會在擷取時封裝小型檔案以改善複製效能。 在這些情況下,您會看到封裝的檔案 (其會有和檔案名稱一樣的 GUID)。 請勿刪除此檔案。 其會在上傳期間解除封裝。

    • 當作業正在進行時,在 [複製資料] 頁面上:

      • 在 [狀態] 資料行中,您可以檢視複製作業的狀態。 狀態可能是:
        • 執行中
        • 失敗
        • 已成功
        • 暫停中
        • 已暫停
        • 取消中
        • 已取消
        • 已完成但發生錯誤
      • 在 [檔案] 資料行中,您可以看到複製中檔案的數量和總體大小。
      • 在 [已處理] 資料行中,您可以看到已處理好檔案的數量和總體大小。
      • 在 [作業詳細資料] 資料行中,選取 [檢視] 即可查看作業詳細資料。
      • 如果複製過程中發生任何錯誤 (如 [錯誤數量] 資料行所示),請移至 [錯誤記錄] 資料行並下載錯誤記錄,以進行疑難排解。

    等待複製作業完成。 因為有些錯誤只會記錄在 [連線並複製] 頁面中,請先確定複製作業已完成且未出現任何錯誤,再進行下一個步驟。

    No errors on

    為了確保資料完整性,在複製資料時會計算內嵌的總和檢查碼。 在複製完成後,請選取 [檢視儀表板] 以確認裝置上已使用的空間和可用空間。

    Verify free and used space on dashboard

    重要

    重複相同的指示,將資料複製到 Data Box Heavy 上的第二個節點。

    在複製作業完成後,您可以選取 [準備寄送]

    注意

    複製作業正在進行時,無法執行 [寄送準備]

    下一步

    請繼續進行下一個教學課程,了解如何將 Data Box Heavy 裝置寄回給 Microsoft。