模組 1:使用 Data Factory 建立管線
此課程模組需要 10 分鐘時間,使用管線中的複製活動,將來源存放區未經處理資料擷取至 Data Lakehouse 的銅級資料表。
課程模組 1 中的高階步驟如下:
- 建立資料管線。
- 使用管線中的複製活動,將範例資料載入 Data Lakehouse。
建立資料管線
需要具有有效訂用帳戶的 Microsoft Fabric 租用戶帳戶。 建立免費帳戶。
請確定您有啟用 Microsoft Fabric 的工作區:建立工作區。
登入 Power BI。
選取畫面左下方的預設 Power BI 圖示,然後選取 [Fabric]。
從 [工作區] 索引標籤中選取工作區,然後選取 [+ 新增專案],然後選擇 [數據管線]。 提供管線名稱。 然後選取建立。
使用管線中的複製活動,將範例資料載入 Data Lakehouse
步驟 1:使用複製助理來設定複製活動。
選取 複製數據助理 以開啟複製助理工具。
步驟 2:在複製助理中設定您的設定。
[複製資料] 對話方塊隨即顯示,並醒目提示第一個步驟 [選擇資料來源]。 從對話框頂端的選項中選取 [範例數據],然後選取 [NYC 計程車 - 綠色。
數據源預覽會接下來出現在 連接到資料來源 頁面上。 檢閱,然後選取 [下一步] [下一步]。
針對複製助理的 [選擇資料目的地] 步驟,選取 [Lakehouse],然後選取 [下一步]。
在出現的資料目的地組態頁面上,選取 [建立新的 Lakehouse],然後輸入新 Lakehouse 的名稱。 再次選取 [下一步]。
現在,在 [選取並對應至資料夾路徑或資料表] 頁面上,設定 Lakehouse 目的地的詳細資料。 選取 [根資料夾] 的 [資料表]、提供資料表名稱,然後選擇 [覆寫] 動作。 請勿選取 [覆寫] 資料表動作之後出現的 [啟用分割區] 核取方塊。
最後,在複製資料助理的 [檢閱 + 儲存] 頁面上,檢閱設定。 在本教學課程中,取消選取 [立即啟動資料傳輸] 核取方塊,因為我們在下一個步驟中手動執行活動。 然後選取確定。
步驟 3:執行並檢視複製活動的結果。
在管線編輯器中選取 [執行] 索引標籤。 然後選取 [執行] 按鈕,根據提示 [儲存並執行],以執行複製活動。
您可以監視執行,並在管線畫布下方的 [輸出] 索引標籤上檢查結果。 選取 [執行詳細資料] 按鈕 (當您將滑鼠停留在執行管線執行時出現的「眼鏡」圖示),以檢視執行詳細資料。
執行詳細資料會顯示讀取和寫入的 1,508,501 個資料列。
展開 [持續時間明細] 區段,以查看複製活動的每個階段持續時間。 檢閱複製詳細資料後,選取 [關閉]。
相關內容
在此端對端教學課程的第一個課程模組 (使用 Microsoft Fabric 中的 Data Factory 進行首次資料整合) 中,您已了解如何:
- 建立資料管線。
- 將複製活動新增至管線。
- 使用範例資料並建立 Data Lakehouse,將資料儲存至新的資料表。
- 執行管線並檢視其詳細資料和持續時間明細。
現在請繼續前往下一節,以建立資料流程。