共用方式為


Azure 資料科學虛擬機器上的機器學習和資料科學工具

Azure 資料科學虛擬機器 (DSVM) 具有一組豐富的機器學習工具和程式庫。 這些資源適用於 Python、R 和 Julia 等熱門語言。

DSVM 支援下列機器學習工具和程式庫:

適用於 Python 的 Azure Machine Learning SDK

如需完整參考,請瀏覽適用於 Python 的 Azure Machine Learning SDK

類別
這是什麼? 您可以使用 Azure Machine Learning 雲端服務來開發及部署機器學習模型。 您可以使用 Python SDK,在進行模型建置、定型、調整規模及管理時加以追蹤。 將模型部署成容器,並在雲端、內部部署環境或 Azure IoT Edge 上執行。
支援的版本 Windows (Conda 環境:AzureML)、Linux (Conda 環境:py36)
一般用法 一般機器學習平台
如何設定或安裝它? 搭配 GPU 支援安裝
如何使用或執行它 作為 Python SDK 並安裝於 Azure CLI 中。 啟動至 Conda 環境 AzureML (Windows 版)「或」啟動至 py36 (Linux 版)。
範例的連結 AzureML 目錄的 [筆記本] 下尋找範例 Jupyter 筆記本。

H2O

類別
這是什麼? 這是一個開放原始碼 AI 平台,支援分散式、快速、記憶體內部、可調式機器學習。
支援的版本 Linux
一般用法 一般用途的分散式、可調式機器學習
如何設定或安裝它? H2O 是安裝在 /dsvm/tools/h2o 中。
如何使用或執行它 使用 X2Go 連線到 VM。 啟動新的終端機,然後執行 java -jar /dsvm/tools/h2o/current/h2o.jar。 然後,啟動網頁瀏覽器並連線到 http://localhost:54321
範例的連結 在 Jupyter 中的 h2o 目錄下尋找 VM 的相關範例。

DSVM 上還有其他幾個機器學習程式庫,例如作為適用於 DSVM 之 Anaconda Python 發行版本一部分的熱門 scikit-learn 套件。 如需以 Python、R 及 Julia 提供的套件清單,請執行個別的套件管理員。

LightGBM

類別
這是什麼? 這是一種以決策樹演算法為基礎的快速、分散式、高效能漸層提升 (GBDT、GBRT、GBM 或 MART) 架構。 若要執行排名、分類等機器學習工作,請使用它。
支援的版本 Windows、Linux
一般用法 一般用途的漸層提升架構
如何設定或安裝它? 在 Windows 上,LightGBM 是以 Python 套件的形式安裝。 在 Linux 上,命令列可執行檔位於 /opt/LightGBM/lightgbm 中。 已安裝 R 套件,並已安裝 Python 套件。
範例的連結 LightGBM 指南 \(英文\)

Rattle

類別
這是什麼? 使用 R 進行資料採礦的圖形化使用者介面。
支援的版本 Windows、Linux
一般用法 適用於 R 的一般 UI 資料採礦工具
如何使用或執行它 作為 UI 工具。 在 Windows 上,啟動命令提示字元、執行 R,然後在 R 內執行 rattle()。 在 Linux 上,使用 X2Go 進行連線、啟動終端機、執行 R,然後在 R 內執行 rattle()
範例的連結 Rattle \(英文\)

Vowpal Wabbit

類別
這是什麼? 快速、開放原始碼的跨核心學習系統程式庫
支援的版本 Windows、Linux
一般用法 一般機器學習程式庫
如何設定或安裝它? Windows:msi 安裝程式
Linux:apt-get
如何使用或執行它 作為路徑上命令列工具 (C:\Program Files\VowpalWabbit\vw.exe (在 Windows 上)、/usr/bin/vw (在 Linux 上))
範例的連結 VowPal Wabbit 範例 \(英文\)

Weka

類別
這是什麼? 這是一個資料採礦工作的機器學習演算法集合。 您可以直接套用演算法,或從自己的 Java 程式碼進行呼叫。 Weka 包含資料前置處理、分類、迴歸、群集、關聯規則和視覺效果的工具。
支援的版本 Windows、Linux
一般用法 一般機器學習程式庫
如何使用或執行它 在 Windows 上,於 [開始] 功能表中搜尋 Weka。 在 Linux 上,使用 X2Go 進行登入,然後移至 [應用程式]>[開發]>[Weka]
範例的連結 Weka 範例 \(英文\)

XGBoost

類別
這是什麼? 快速、可攜且分散式的漸層提升 (GBDT、GBRT 或 GBM) 程式庫,適用於 Python、R、JAVA、Scala、C++ 等。 它可在單一機器、Apache Hadoop 及 Spark 上執行。
支援的版本 Windows、Linux
一般用法 一般機器學習程式庫
如何設定或安裝它? 搭配 GPU 支援安裝
如何使用或執行它 作為 Python 程式庫 (2.7 和 3.6+)、R 套件及路徑上命令列工具 (C:\dsvm\tools\xgboost\bin\xgboost.exe 適用於 Windows、/dsvm/tools/xgboost/xgboost 適用於 Linux)
範例的連結 範例包含在 VM 的 /dsvm/tools/xgboost/demo(適用於 Linux) 中,以及 C:\dsvm\tools\xgboost\demo (適用於 Windows) 中。