統計函數
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
本文說明機器學習 Studio (傳統) 中的模組,這些模組支援機器學習服務的關鍵數學和統計作業。 如果您需要在實驗中執行下列工作,請查看 統計函數 類別:
- 對資料行值執行臨機操作計算,例如四捨五入或使用絕對值。
- 機器學習中常用的計算方式、對數和其他統計資料。
- 計算相互關聯和機率分數。
- 計算 z 分數。
- 計算廣泛使用的統計分佈,例如韋伯、gamma 和搶鮮版(Beta)。
- 產生一組資料行或資料集的統計報告。
例如,如果您有新的資料集,您可能會先使用「 摘要資料 」模組。 它會產生整個資料集的報表,其中包含標準統計量值,例如平均值和標準差。
如果您需要更高階的統計資料,例如範例不對稱或 interquartile 距離,請使用 計算基本統計 資料模組來產生額外的描述性統計資料。
因為模組會在您每次執行實驗時產生結果,所以當您的資料變更時,會更新結果。
模組清單
統計函數類別包含下列模組:
- 套用數學運算:將數學運算套用至資料行值。
- 計算基本統計資料:為選取的資料集資料行計算指定的摘要統計資料。
- 計算線性相互關聯:計算資料集中資料行值之間的線性關聯。
- 評估機率函數:將指定的機率分佈函數納入資料集。
- 取代離散值:根據另一個資料行,以數值取代一個資料行的離散值。
- 摘要資料:為資料集中的資料行產生基本描述性統計資料包表。
- 使用 t 測試的測試假設:透過使用 t 測試來比較兩個資料集的意義。