教學課程:使用數據複製服務將數據複製到 Azure 數據箱
本教學課程說明如何使用資料複製服務擷取資料,而不需要中繼主機。 數據複製服務會在 Azure 資料箱上本機執行、透過伺服器消息塊 (SMB) 通訊協定連線記憶體 (NAS) 裝置,並將資料複製到資料箱。
使用資料複製服務:
- 在可能無法使用中繼主機的 NAS 環境中使用。
- 搭配需要數週時間來擷取和上傳資料的小型檔案。 資料複製服務可大幅改善小型檔案的擷取和上傳時間。
注意
未正式支援與非 Windows NAS 裝置的複製服務相容性。
在本教學課程中,您會了解如何:
- 將資料複製到資料箱
必要條件
開始進行本教學課程之前:
- 完成設定 Azure 數據箱教學課程。
- 確定您的數據箱裝置已傳遞,且入口網站中的訂單狀態為 [已傳遞]。
- 請確定您有包含源數據的 NAS 裝置認證。
- 請確定您已連線到高速網路。 強烈建議您具有至少一個 10 GbE 的連線。 如果 10 GbE 連線無法使用,但複製速度受到影響,您可以使用 1-GbE 數據連結。
將資料複製到資料箱
在連線至 NAS 裝置後,下一個步驟是複製資料。
重要
若要避免數據損毀或遺失的可能性,請確定您遵循建議的做法:
- 在起始數據複製作業之前,請確定數據大小符合 Azure 記憶體和資料箱限制一文中所述 的大小限制 。
- 確定數據不會由數據箱以外的其他應用程式上傳至數據箱。 同時的數據複製作業可能會導致上傳作業失敗和數據損毀。
- 確定資料複製服務讀取時不會修改源數據。 在複製作業期間修改數據可能會導致失敗或數據損毀。
- 請確定您維護源數據的複本,直到數據箱傳輸程式完成,且您的數據可在 Azure 儲存體 記憶體取。
若要使用資料複製服務來複製資料,您需要建立一項作業:
在資料箱裝置的本機 Web UI 中,選取 [管理>複製數據]。
在 [複製資料] 頁面上,選取 [建立]。
在 [設定作業並啟動] 對話方塊中,填寫下列欄位:
欄位 值 作業名稱 作業的唯一名稱超過 230 個字元。 作業名稱中不允許以下字元:<、>、|、?、*、\、:、/ 和 \。 來源位置 以下列格式提供資料來源的 SMB 路徑: \\<ServerIPAddress>\<ShareName>
或\\<ServerName>\<ShareName>
。使用者名稱 用以存取資料來源的使用者名稱 (採用 \\<DomainName><UserName>
格式)。 本機系統管理員需要明確的安全性許可權。 以滑鼠右鍵按下資料夾,選取 [屬性],然後選取 [安全性] 以在 [安全性] 索引標籤中新增本機系統管理員。密碼 用以存取資料來源的密碼。 目的地儲存體帳戶 從清單中選取要作為資料上傳目的地的儲存體帳戶。 目的地類型 從清單中選取目標儲存體類型:區塊 Blob、分頁 Blob、Azure 檔案儲存體或區塊 Blob (封存)。 目的地容器/共用 輸入位於目的地儲存體帳戶中,要作為資料上傳目的地容器或共用的名稱。 此名稱可以是共用名稱或容器名稱。 例如,使用 myshare
或mycontainer
。 您也可以使用sharename\directory_name
或containername\virtual_directory_name
格式來輸入名稱。複製符合模式的檔案 您可以利用下列兩種方式來輸入檔案名稱比對模式: - 使用萬用字元運算式:萬用字元運算式僅支援
*
和?
。 例如,*.vhd
運算式會比對所有具有.vhd
副檔名的檔案。 同樣地,*.dl?
會使用.dl
副檔名或開頭為.dl
的副檔名 (例如,.dll
) 來比對所有檔案。 同樣地,*foo
會比對名稱結尾為foo
的所有檔案。
您可以在欄位中直接輸入萬用字元運算式。 根據預設,系統會將此欄位中的輸入值視為萬用字元運算式。 - 使用規則運算式:支援 POSIX 型規則運算式。 例如,正則表達式
.*\.vhd
符合擴展名.vhd
的所有檔案。 針對規則運算式,直接提供<pattern>
作為regex(<pattern>)
。 如需有關規則運算式的詳細資訊,請移至規則運算式語言 - 快速參考。
檔案最佳化 這項功能啟用時,系統會在擷取期間封裝小於 1 MB 的檔案。 此封裝動作可加快小型檔案的資料複製作業。 此外,當檔案數目遠遠超過目錄數目時,亦可省下不少時間。
如果您使用檔案優化:- 執行準備寄送之後,您可以 下載會列出源檔名稱的材質帳單 (BOM) 檔案,以協助您確定已複製所有正確的檔案。
- 請勿刪除包裝的檔案,其檔案名開頭為
ADB_PACK_
。 如果您刪除封裝的檔案,則不會在未來的資料複製期間上傳原始檔案。 - 請勿複製您透過其他通訊協定 (例如 SMB、NFS 或 REST API) 使用 [複製服務] 複製的相同檔案。 使用不同的通訊協定可能會導致資料上傳期間發生衝突和失敗。
- Azure 檔案儲存體 不支援檔案優化。 若要查看哪些時間戳、檔案屬性和訪問控制清單 (ACL) 會針對未優化的數據複製作業複製,請參閱 傳輸的元數據 一文。
- 使用萬用字元運算式:萬用字元運算式僅支援
選取 [開始]。 系統會驗證輸入的內容,如果驗證成功,便會啟動作業。 系統可能需要花幾分鐘的時間才能讓作業啟動。
使用指定的設定來建立作業。 您可以暫停、繼續、取消或重新啟動作業。 選取作業名稱旁的核取方塊,然後選取適當按鈕。
如果作業在尖峰時段會影響 NAS 裝置的資源,您可以將其暫停:
您可以在離峰時段繼續作業:
您可以隨時取消作業:
取消作業時必須進行確認:
取消複製作業並不會刪除作業期間已複製到裝置的任何數據。 若要刪除已複製到資料箱裝置的數據,請重設裝置。
注意
如果您取消或暫停作業,大型檔案可能只複製了一部分。 這些部分複製的檔案會以相同的狀態上傳至 Azure。 當您取消或暫停作業時,請確定檔案是否已徹底複製完成。 若要驗證檔案,請查看 SMB 共用或下載 BOM 檔案。
您可以重新啟動因暫時性錯誤而發生的失敗作業,例如網路故障。 不過,作業在到達終端機狀態后無法重新啟動,例如 成功 或 已完成,併發生錯誤。 記錄檔案命名或檔案大小問題所造成的錯誤,但在作業完成之後就無法重新啟動。
如果您遇到失敗且無法重新啟動作業,請下載錯誤記錄並找出基礎失敗。 修正問題之後,請建立新的作業來複製檔案。 或者,您也可以 透過SMB複製檔案。
目前的版本不支援作業刪除。
您可以建立的作業數量沒有限制,但一次最多只能平行執行 10 個作業。
如果 [檔案優化 ] 開啟,小型檔案會封裝在上傳期間內嵌和解壓縮,以改善複製效能。 這些封裝的檔案是使用 GUID 來命名。 請勿刪除已封裝的檔案。
作業進行時,會在 [複製資料] 頁面上顯示 下列資料 :
- [狀態] 資料行會顯示複製作業的狀態。 有效狀態包括:
- 執行中
- 失敗
- 已成功
- 暫停中
- 已暫停
- 取消中
- 已取消
- 已完成但發生錯誤
- [ 檔案 ] 資料行會顯示要複製之檔案的數目和總大小。
- [已處理] 資料行會顯示已處理之檔案的數目和總大小。
- [作業詳細數據] 資料行提供檢視作業詳細數據的連結。
- [ # Errors] 資料行會顯示複製程式期間遇到的錯誤數目。 若要下載錯誤記錄檔以進行疑難解答,請選取對應 錯誤記錄 數據行內的連結。
- [狀態] 資料行會顯示複製作業的狀態。 有效狀態包括:
等待複製作業完成。 由於某些錯誤只會記錄在 [ 連線和複製 ] 頁面上,請確定複製作業已完成,而且在前進到下一個步驟之前,不會報告任何錯誤。
為了確保資料完整性,在複製資料時會計算內嵌的總和檢查碼。 在複製完成後,請選取 [檢視儀表板] 以確認裝置上已使用的空間和可用空間。
在複製作業完成後,您可以選取 [準備寄送]。
注意
複製作業正在進行時,無法執行 [寄送準備]。
下一步
請繼續進行下一個教學課程,了解如何將資料箱裝置寄回給 Microsoft。