在 Microsoft Fabric 中使用端對端 AI 範例
Microsoft Fabric 中的 Synapse 資料科學軟體即服務 (SaaS) 體驗可協助機器學習專業人員在單一分析平台中建置、部署及運作其機器學習模型,同時與其他重要角色共同作業。 本文說明 Synapse 資料科學體驗的功能,以及機器學習模型如何解決常見的商務問題。
安裝 Python 程式庫
某些端對端 AI 範例需要其他程式庫,才能進行機器學習模型開發或特定資料分析。 您可以選擇其中一個選項,快速安裝 Apache Spark 工作階段的程式庫。
使用內嵌安裝功能進行安裝
使用 Python 內嵌安裝功能,例如 %pip
或 %conda
- 在您的筆記本中安裝新的程式庫。 此選項只會在目前的筆記本中安裝程式庫,而不是在工作區中安裝。 使用此程式碼來安裝程式庫。 將 <library name>
取代為程式庫的名稱:imblearn
或 wordcloud
。
# Use pip to install libraries
%pip install <library name>
# Use conda to install libraries
%conda install <library name>
設定工作區的預設程式庫
若要讓您的程式庫可在工作區的任何筆記本中使用,可以使用 Fabric 環境 來實現此目的。 您可以建立環境、在其中安裝程式庫,然後您的工作區管理員可以將環境連結至工作區作為其預設環境。 如需將環境設定為工作區預設值的詳細資訊,請參閱管理員設定工作區的預設程式庫。
重要
不再支援工作區設定的程式庫管理。 您可以遵循「將工作區程式庫和 Spark 屬性移轉至預設環境」,將現有的工作區程式庫移轉至環境,並將其連結為工作區預設值。
依照教學課程建立機器學習模型
這些教學課程提供了常見案例的端對端範例。
客戶流失
建置模型來預測銀行客戶的流失率。 流失率,也稱為流失比率,是指客戶停止銀行業務的比率。
遵循預測客戶流失率教學課程中的指示。
建議
一家線上書店想要提供自訂建議來增加銷售額。 透過客戶書籍評等資料,您可以開發和部署建議模型來進行預測。
遵循訓練零售建議模型教學課程中的指示。
詐騙偵測
隨著未經授權的交易增加,即時信用卡詐騙偵測可以協助金融機構為客戶提供更快速的解決方案。 詐騙偵測模型包括預處理、訓練、模型儲存體和推斷。 訓練元件會檢閱多個模型和方法,以解決陽性誤判與陰性誤判之間的不平衡範例和取捨等挑戰。
遵循詐騙偵測教學課程中的指示。
預測
利用紐約市過往的房地產銷售資料,以及 Facebook Prophet,建置具有趨勢和季節性資訊的時間序列模型,以預測未來週期中的銷售額。
遵循時間序列預測教學課程中的指示。
文字分類
在 Spark 中使用 word2vec 和線性迴歸模型套用文字分類,以根據書籍中繼資料預測大英圖書館中的書籍為小說還是非小說。
遵循文字分類教學課程中的指示。
提升模型
以提升模式估算某些醫學治療對個人行為的因果影響。 在這些模組中觸控四個核心區域:
- 資料處理模組:擷取特徵、處理和標籤。
- 訓練模組:使用經典機器學習模型 (例如 LightGBM) 來預測個人在接受治療與未接受治療時的行為差異。
- 預測模組:呼叫提升模型來預測測試資料。
- 評估模組:評估提升模型對測試資料的影響。
遵循醫學治療因果影響教學課程中的指示。
預測性維護
根據歷史資料訓練多個模型,以預測機械故障,例如溫度和旋轉速度。 然後,判定哪一個模型最適合用來預測未來的失敗。
遵循預測性維護教學課程中的指示。
銷售趨勢預測
預測超市產品類別的未來銷售。 根據歷程記錄資料訓練模型來執行此動作。
遵循銷售預測教學課程中的指示。