說明資料處理站流程
資料驅動工作流程
Azure Data Factory 中的管線 (資料驅動工作流程) 通常會執行下列四個步驟:
連線及收集
組建協調流程系統的第一步是定義及連接所有必要的資料來源,例如資料庫、檔案共用、及 FTP Web 服務。 下一步是視需要將資料內嵌到集中位置以進行後續處理。
轉換及擴充
Databricks 和 Machine Learning 等計算服務可用於在可維護且受控的排程上準備或產生轉換的資料,以提供清理及轉換的資料給生產環境。 在某些執行個體中,您甚至可能會使用其他資料來增強來源資料以協助分析。或者舉例來說,也可透過正規化流程來合併來源資料,以供在 Machine Learning 實驗中使用。
發佈
當未經處理的資料透過轉換及擴充階段,精簡成符合業務需求的可取用形式後,您便可以將該資料載入 Azure 資料倉儲、Azure SQL Database、Azure Cosmos DB 或企業用戶可從其商業智慧工具指向的分析引擎
監視器
Azure Data Factory 透過 Azure 監視器、API、PowerShell、Azure 監視器記錄和 Azure 入口網站上的健康情況面板,提供內建管線監視支援,可監視已排程的活動及管線的成功和失敗率。