Azure 資料科學虛擬機器 (DSVM) 具有一組豐富的機器學習工具和程式庫。 這些資源適用於 Python、R 和 Julia 等熱門語言。
DSVM 支援下列機器學習工具和程式庫:
適用於 Python 的 Azure Machine Learning SDK
如需完整參考,請瀏覽適用於 Python 的 Azure Machine Learning SDK。
類別 |
值 |
這是什麼? |
您可以使用 Azure Machine Learning 雲端服務來開發及部署機器學習模型。 您可以使用 Python SDK,在進行模型建置、定型、調整規模及管理時加以追蹤。 將模型部署成容器,並在雲端、內部部署環境或 Azure IoT Edge 上執行。 |
支援的版本 |
Windows (Conda 環境:AzureML)、Linux (Conda 環境:py36) |
一般用法 |
一般機器學習平台 |
如何設定或安裝它? |
搭配 GPU 支援安裝 |
如何使用或執行它 |
作為 Python SDK 並安裝於 Azure CLI 中。 啟動至 Conda 環境 AzureML (Windows 版)「或」啟動至 py36 (Linux 版)。 |
範例的連結 |
在 AzureML 目錄的 [筆記本] 下尋找範例 Jupyter 筆記本。 |
H2O
類別 |
值 |
這是什麼? |
這是一個開放原始碼 AI 平台,支援分散式、快速、記憶體內部、可調式機器學習。 |
支援的版本 |
Linux |
一般用法 |
一般用途的分散式、可調式機器學習 |
如何設定或安裝它? |
H2O 是安裝在 /dsvm/tools/h2o 中。 |
如何使用或執行它 |
使用 X2Go 連線到 VM。 啟動新的終端機,然後執行 java -jar /dsvm/tools/h2o/current/h2o.jar 。 然後,啟動網頁瀏覽器並連線到 http://localhost:54321 。 |
範例的連結 |
在 Jupyter 中的 h2o 目錄下尋找 VM 的相關範例。 |
DSVM 上還有其他幾個機器學習程式庫,例如作為適用於 DSVM 之 Anaconda Python 發行版本一部分的熱門 scikit-learn
套件。 如需以 Python、R 及 Julia 提供的套件清單,請執行個別的套件管理員。
LightGBM
類別 |
值 |
這是什麼? |
這是一種以決策樹演算法為基礎的快速、分散式、高效能漸層提升 (GBDT、GBRT、GBM 或 MART) 架構。 若要執行排名、分類等機器學習工作,請使用它。 |
支援的版本 |
Windows、Linux |
一般用法 |
一般用途的漸層提升架構 |
如何設定或安裝它? |
在 Windows 上,LightGBM 是以 Python 套件的形式安裝。 在 Linux 上,命令列可執行檔位於 /opt/LightGBM/lightgbm 中。 已安裝 R 套件,並已安裝 Python 套件。 |
範例的連結 |
LightGBM 指南 \(英文\) |
Rattle
類別 |
值 |
這是什麼? |
使用 R 進行資料採礦的圖形化使用者介面。 |
支援的版本 |
Windows、Linux |
一般用法 |
適用於 R 的一般 UI 資料採礦工具 |
如何使用或執行它 |
作為 UI 工具。 在 Windows 上,啟動命令提示字元、執行 R,然後在 R 內執行 rattle() 。 在 Linux 上,使用 X2Go 進行連線、啟動終端機、執行 R,然後在 R 內執行 rattle() 。 |
範例的連結 |
Rattle \(英文\) |
Vowpal Wabbit
類別 |
值 |
這是什麼? |
快速、開放原始碼的跨核心學習系統程式庫 |
支援的版本 |
Windows、Linux |
一般用法 |
一般機器學習程式庫 |
如何設定或安裝它? |
Windows:msi 安裝程式 Linux:apt-get |
如何使用或執行它 |
作為路徑上命令列工具 (C:\Program Files\VowpalWabbit\vw.exe (在 Windows 上)、/usr/bin/vw (在 Linux 上)) |
範例的連結 |
VowPal Wabbit 範例 \(英文\) |
Weka
類別 |
值 |
這是什麼? |
這是一個資料採礦工作的機器學習演算法集合。 您可以直接套用演算法,或從自己的 Java 程式碼進行呼叫。 Weka 包含資料前置處理、分類、迴歸、群集、關聯規則和視覺效果的工具。 |
支援的版本 |
Windows、Linux |
一般用法 |
一般機器學習程式庫 |
如何使用或執行它 |
在 Windows 上,於 [開始] 功能表中搜尋 Weka。 在 Linux 上,使用 X2Go 進行登入,然後移至 [應用程式]>[開發]>[Weka]。 |
範例的連結 |
Weka 範例 \(英文\) |
XGBoost
類別 |
值 |
這是什麼? |
快速、可攜且分散式的漸層提升 (GBDT、GBRT 或 GBM) 程式庫,適用於 Python、R、JAVA、Scala、C++ 等。 它可在單一機器、Apache Hadoop 及 Spark 上執行。 |
支援的版本 |
Windows、Linux |
一般用法 |
一般機器學習程式庫 |
如何設定或安裝它? |
搭配 GPU 支援安裝 |
如何使用或執行它 |
作為 Python 程式庫 (2.7 和 3.6+)、R 套件及路徑上命令列工具 (C:\dsvm\tools\xgboost\bin\xgboost.exe 適用於 Windows、/dsvm/tools/xgboost/xgboost 適用於 Linux) |
範例的連結 |
範例包含在 VM 的 /dsvm/tools/xgboost/demo (適用於 Linux) 中,以及 C:\dsvm\tools\xgboost\demo (適用於 Windows) 中。 |