使用 Azure Databricks 來實作機器學習解決方案
Azure Databricks 是一種適用於資料分析和機器學習的雲端規模平台。 資料科學家和機器學習工程師可以使用 Azure Databricks,大規模實作機器學習解決方案。
必要條件
此學習路徑假設您有使用 Python 探索資料,以及使用常見的開放原始碼架構 (例如 Scikit-Learn、PyTorch 和 TensorFlow) 訓練機器學習模型的體驗。 開始此學習路徑之前,建議先完成建立機器學習模型學習路徑。
成就代碼
您要請求成就代碼嗎?
此學習路徑中的課程模組
Azure Databricks 是一項雲端服務,能提供可調整的平台來使用 Apache Spark 進行資料分析。
Azure Databricks 是以 Apache Spark 為基礎所建置,可讓資料工程師和分析師執行 Spark 作業,以大規模轉換、分析和視覺化資料。
機器學習涉及使用資料來將預測模型定型。 Azure Databricks 支援多個常用的機器學習架構,可讓您用來將模型定型。
MLflow 是一個開放原始碼平台,可管理 Azure Databricks 中原生支援的機器學習生命週期。
微調超參數是機器學習不可或缺的一部分。 在 Azure Databricks 中,您可以使用 Hyperopt 程式庫自動最佳化超參數。
Azure Databricks 中的 AutoML 可簡化為您資料建置有效機器學習模型的程序。
深度學習會使用神經網路來定型高效能的機器學習模型,以進行複雜的預測、電腦視覺、自然語言處理及其他 AI 工作負載。
機器學習可啟用資料驅動的決策和自動化,但將模型部署到生產環境以取得即時深入解析是一項挑戰。 Azure Databricks 藉由提供統一的平台,大規模建置、定型和部署機器學習模型,促進資料科學家和工程師之間的共同作業,以簡化此程序。