比較 Microsoft 機器學習產品與技術
了解 Microsoft 的機器學習產品和技術。 比較各個選項,以幫助您選擇最有效的方式來建置、部署和管理您的機器學習解決方案。
雲端式機器學習產品
以下選項可用於 Azure 雲端中的機器學習。
雲端選項 | 內容 | 產品用途 |
---|---|---|
Azure Machine Learning | 機器學習受控平台 | 使用預先定型的模型,或使用 Python 和 CLI 在 Azure 上定型、部署及管理模型。 包含自動化機器學習 (AutoML)、提示流程、模型類別目錄和 MLflow 整合等功能。 追蹤並了解生產期間的模型效能 |
Microsoft Fabric | 整合分析平台 | 管理整個數據生命週期,從擷取到深入解析,以及整合各種數據專業人員服務和工具的完整平臺,包括數據工程師、數據科學家和商務分析師 |
Azure AI 服務 | 透過 REST API 和 SDK 實作的預先建置 AI 功能 | 使用標準程式設計語言建置智慧型手機應用程式,以呼叫提供推斷的 API。 雖然機器學習和數據科學專業知識仍然很理想,但此平臺也可以由沒有這類技能的工程小組採用 |
Azure SQL 受控執行個體機器學習服務 | SQL 的資料庫內機器學習 | 在 Azure SQL 受控執行個體中訓練和部署模型 |
Azure Synapse Analytics 中的機器學習 | 具有機器學習功能的分析服務 | 在 Azure Synapse Analytics 中訓練和部署模型 |
Azure Databricks | 以 Apache Spark 為基礎的分析平台 | 使用與開放原始碼機器學習庫和 MLflow 平台的整合,來建立和部署模型和資料工作流程。 |
內部部署機器學習產品
下列選項適用於內部部署機器學習服務。 內部部署伺服器也可以在雲端的虛擬機器中運作。
內部部署 | 內容 | 產品用途 |
---|---|---|
SQL Server Machine Learning 服務 | SQL 的資料庫內機器學習 | 使用 Python 和 R 腳本在 SQL Server 內定型和部署模型 |
開發平台和工具
以下開發平台和工具可用於機器學習。
平台/工具 | 內容 | 產品用途 |
---|---|---|
Azure AI Studio | AI 和 ML 案例的整合開發環境 | 開發、評估和部署 AI 模型和應用程式。 協助跨各種 Azure AI 服務進行共同作業和專案管理,甚至可以作為多個工作負載小組的共同環境。 |
Azure 機器學習 Studio | 機器學習的共同作業、拖放工具 | 使用最少的程式代碼建置、測試及部署預測性分析解決方案。 支援各種機器學習演算法和 AI 模型。 其具有數據準備、模型定型和評估的工具。 |
Azure 資料科學虛擬機器 | 具有預安裝數據科學工具的虛擬機映像 | 使用 Jupyter、R 和 Python 等工具,在您自己的 VM 上開發機器學習解決方案。 |
ML.NET | 開放原始碼、跨平台機器學習 SDK | 開發適用於 .NET 應用程式的機器學習解決方案。 |
Windows AI | Windows 裝置上定型模型的推斷引擎 | 平臺,使用 Windows 機器學習 (WinML) 和 Direct 機器學習 (DirectML) 等元件,將人工智慧功能整合到 Windows 應用程式中,以進行本機、即時 AI 模型評估和硬體加速。 |
SynapseML | 適用於 Apache Spark 的開放原始碼分散式機器學習和微服務架構 | 為 Scala 和 Python 建立和部署可擴展的機器學習應用程式。 |
Azure Data Studio 的機器學習擴充功能 | Azure Data Studio 的開放原始碼與跨平台機器學習擴充功能 | 管理套件、匯入機器學習模型、進行預測,以及建立筆記本來為 SQL 資料庫執行實驗 |
Azure Machine Learning
Azure Machine Learning 是一項完全受控的雲端服務,用於大規模訓練、部署和管理機器學習模型。 它完全支援開放原始碼技術,因此您可以使用 TensorFlow、PyTorch、scikit-learn 等數以萬計的開放原始碼 Python 套件。 您也可以使用豐富的工具,例如計算實例、Jupyter Notebook 或適用於 Visual Studio Code 的 Azure 機器學習 (VS Code) 延伸模組,這是一個免費的擴充功能,可讓您在 Visual Studio Code 中管理資源、模型定型工作流程和部署。 Azure Machine Learning 包含自動生成和調整模型功能,使用過程輕鬆、有效率且準確。
使用 Python SDK、Jupyter Notebook、R 和 CLI 進行雲端規模的機器學習。 如果您想使用低程式碼或無程式碼選項,請在工作室中使用Azure Machine Learning 的互動式設計工具,使用預先建置的機器學習演算法輕鬆快速地建置、測試和部署模型。 此外,Azure 機器學習 提供與 Azure DevOps 和 GitHub Actions 的整合,以進行機器學習模型的持續整合和持續部署(CI/CD)。
項目 | 描述 |
---|---|
類型 | 雲端式機器學習解決方案 |
支援的語言 | Python、R |
機器學習階段 | 資料準備 模型訓練 部署 MLOps/管理 負責 AI |
主要優點 | Code First (SDK) 以及 studio 和拖放設計工具 Web 介面撰寫選項。 集中管理指令碼和執行歷程記錄,讓您可以輕鬆比較模型版本。 輕鬆管理模型,並將其部署到雲端或邊緣裝置。 提供可調整的機器學習模型定型、部署和管理。 |
考量 | 需要對模型管理模型有一定的了解。 |
Azure AI 服務
Azure AI 服務 是一套完整的預先建置 API,可讓開發人員和組織快速建立智慧型手機市場就緒的應用程式。 這些服務提供現成且可自定義的 API 和 SDK,可讓您的應用程式使用最少的程式代碼來查看、聆聽、說話、瞭解和解譯使用者需求,因此不需要引進數據集或數據科學專業知識來定型模型。 您可以將智慧型功能新增至您的應用程式,例如:
- 視覺:物體偵測、臉部辨識、光學字元辨識 (OCR) 等。 如需詳細資訊,請參閱 電腦視覺、臉部、文件智慧。
- 語音:語音轉換文字、文字轉換語音、說話者辨識等。 有關詳細資訊,請參閱「語音服務」。
- 語言:翻譯、情緒分析、關鍵字擷取、語言理解等。 如需詳細資訊,請參閱 Azure OpenAI 服務、翻譯工具、沉浸式閱讀程式、Bot 服務和語言服務。
- 決策: 偵測垃圾內容,並做出明智的決策 內容安全性。
- 搜尋和知識: 將 AI 支援的雲端搜尋和知識採礦功能帶入您的應用程式。 如需詳細資訊,請參閱 Azure AI 搜尋。
使用 Azure AI 服務跨裝置和平台開發應用程式。 這些 API 不斷改進,並且易於設定。
項目 | 描述 |
---|---|
類型 | 用於建立智慧應用程式的 API |
支援的語言 | 根據服務的不同有不同的選擇。 標準的是 C#、Java、JavaScript 和 Python。 |
機器學習階段 | 部署 |
主要優點 | 使用透過 REST API 和 SDK 提供的預訓練模型建立智慧應用程式。 視覺、語音、語言和決策等自然溝通方法的各種模型。 不需要或最少的機器學習或數據科學專業知識。 延展性和彈性。 各種模型。 |
SQL 機器學習
SQL 機器學習在 Python 和 R 中為內部部署和雲端的關聯式資料新增了統計分析、資料視覺化和預測分析。 目前的平台和工具包括:
- SQL Server Machine Learning 服務
- Azure SQL 受控執行個體機器學習服務
- Azure Synapse Analytics 中的機器學習
- Azure Data Studio 的機器學習擴充功能
當您需要對 SQL 中的關聯式資料進行內建 AI 和預測分析時,請使用 SQL 機器學習。
項目 | 描述 |
---|---|
類型 | 關聯式資料的內部部署預測分析 |
支援的語言 | Python、R、SQL |
機器學習階段 | 資料準備 模型訓練 部署 |
主要優點 | 將預測邏輯封裝在資料庫函式中,使其易於包含在資料層邏輯中。 |
考量 | 假設 SQL 資料庫作為應用程式的資料層。 |
Azure AI Studio
Azure AI Studio 是一個統一的平臺,可負責開發和部署產生式 AI 應用程式和 Azure AI API。 它提供一組完整的 AI 功能、簡化的使用者介面和程式代碼優先體驗,使其成為建置、測試、部署及管理智慧型解決方案的一站式商店。 Azure AI Studio 旨在協助開發人員和數據科學家使用 Azure 廣泛的 AI 供應專案有效率地建立和部署產生式 AI 應用程式,而 Azure AI Studio 強調負責任 AI 開發,並採用公平、透明度和責任的內嵌原則。 此平臺包含偏差偵測、可解釋性和隱私權保留機器學習的工具,確保 AI 模型強大、可信任且符合法規需求。 作為Microsoft Azure 生態系統的一部分,AI Studio 提供強大的工具和服務,以滿足各種 AI 和機器學習需求,從自然語言處理到電腦視覺。 其與其他 Azure 服務的整合可確保順暢的延展性和效能,使其非常適合企業。 Azure AI Studio 也會促進共同作業和創新,支援具有共用工作區、版本控制及集成開發環境等功能的共同作業環境。 藉由整合熱門的開放原始碼架構和工具,Azure AI Studio 可加速開發程式,讓組織能夠推動創新,並在競爭激烈的 AI 環境中保持領先。
項目 | 描述 |
---|---|
類型 | 適用於 AI 整合開發環境 |
支援的語言 | 只使用 Python |
機器學習階段 | 資料準備 部署 (模型即服務) |
主要優點 | 協助跨各種 Azure AI 服務進行共同作業和專案管理。 提供建置、定型和部署 AI 模型的完整工具。 使用偏差偵測、可解釋性和隱私權保留機器學習的工具強調負責任的 AI。 支援與熱門的開放原始碼架構和工具整合。 包含Microsoft提示流程,以建立和管理以提示為基礎的工作流程,簡化由大型語言模型 (LLM) 提供之 AI 應用程式的開發週期。 |
Azure Machine Learning studio
Azure 機器學習 Studio 是一種共同作業的拖放工具,可用來建置、測試及部署數據上的預測性分析解決方案。 它專為數據科學家、數據工程師和商務分析師所設計。 Azure Machine Learning 工作室 支援各種不同的機器學習演算法和工具,以進行數據準備、模型定型和評估。 它也提供可視化介面來連接互動式畫布上的數據集和模組。
項目 | 描述 |
---|---|
類型 | 機器學習的共同作業、拖放工具 |
支援的語言 | Python、R、Scala 和 Java (體驗有限) |
機器學習階段 | 資料準備 模型訓練 部署 |
主要優點 | 不需要撰寫程式代碼即可建置機器學習模型。 支援各種機器學習演算法和工具,以進行數據準備、模型定型和評估。 提供可視化介面,以連接互動式畫布上的數據集和模組。 支援與 Azure 機器學習 整合以進行進階機器學習工作。 |
如需 Azure Machine Learning 工作室 和 Azure AI Studio 的壓縮比較,請參閱 AI Studio 或 Azure 機器學習 Studio。 以下是兩者之間的一些主要差異:
類別 | 功能 | Azure AI Studio | Azure Machine Learning studio |
---|---|---|---|
數據記憶體 | 儲存方案 | No | 是 (雲端檔案系統、OneLake、Azure 儲存體) |
數據準備 | 資料整合 | 是(Blob 記憶體、OneLake、ADLS) | 是(複製並掛接 Azure 儲存體 帳戶) |
開發 | 程式代碼優先工具 | 是 (Visual Studio Code (VS Code)) | 是(Notebooks、Jupyter、VS Code、R Studio) |
語言 | 支援的語言 | 只使用 Python | Python、R、Scala、Java |
訓練 | AutoML | No | 是(回歸、分類、預測、CV、NLP) |
計算目標 | 定型計算 | 無伺服器 (MaaS, 提示流程) | Spark 叢集、ML 叢集、Azure Arc |
生成式 AI | LLM 目錄 | 是 (Azure OpenAI, 擁抱臉部, Meta) | 是 (Azure OpenAI, 擁抱臉部, Meta) |
[部署] | 即時和批次服務 | 即時 (MaaS) | Batch 端點、Azure Arc |
治理 | 負責任的 AI 工具 | No | 是 (負責任的 AI 儀錶板) |
Microsoft Fabric
Microsoft Fabric 是端對端整合分析平臺,可將組織所需的所有數據和分析工具整合在一起。 它整合了各種服務和工具,為數據專業人員提供順暢的體驗,包括數據工程師、數據科學家和商務分析師。 Microsoft Fabric 提供數據整合、數據工程、數據倉儲、數據科學、即時分析和商業智慧的功能。
當您需要完整的平臺來管理整個數據生命週期,從擷取到深入解析時,請使用 Microsoft Fabric。
項目 | 描述 |
---|---|
類型 | 整合分析平台 |
支援的語言 | Python、R、SQL、Scala |
機器學習階段 | 資料準備 模型訓練 部署 即時分析 |
主要優點 | 適用於所有數據和分析需求的整合平臺。 與其他 Microsoft 服務緊密整合。 可調整且具彈性。 支援各種不同的數據和分析工具。 促進組織中不同角色的共同作業。 從擷取到深入解析的端對端數據生命週期管理。 即時分析和商業智慧功能。 支援機器學習模型定型和部署。 與熱門的機器學習架構和工具整合。 提供數據準備和特徵工程的工具。 啟用即時機器學習推斷和分析。 |
Azure 資料科學虛擬機器
Azure 資料科學虛擬機器是 Microsoft Azure 雲端上的自訂虛擬機器環境。 它有 Windows 和 Linux Ubuntu 的版本。 該環境是專門為進行資料科學和開發機器學習解決方案而構建的。 它預先安裝和預先設定了許多熱門的資料科學、機器學習架構和其他工具,以快速啟動建置用於進階分析的智慧型應用程式。
當您需要在單一節點上執行或裝載作業時,請使用資料科學 VM。 或者,如果您需要在單一機器上遠端擴展處理能力。
項目 | 描述 |
---|---|
類型 | 資料科學客製化虛擬機器環境 |
主要優點 | 減少資料科學工具和架構的安裝、管理和故障排除時間。 包括所有常用工具和架構的最新版本。 虛擬機器選項包括高度可擴展的影像,具有用於密集資料建模的圖形處理單元 (GPU) 功能。 |
考量 | 離線時無法存取虛擬機器。 執行虛擬機器會產生 Azure 費用,因此您必須小心,並且僅在需要時執行虛擬機器。 |
Azure Databricks
Azure Databricks 是一個以 Apache Spark 為基礎的分析平台,針對 Microsoft Azure 雲端平台進行了最佳化。 Databricks 與 Azure 整合,可提供一鍵式設定、簡化的工作流程和互動式工作區,支援資料科學家、資料工程師和業務分析師之間的協作。 在 Web 式筆記本中使用 Python、R、Scala 和 SQL 程式碼來查詢、視覺化和建模資料。
當您想要在 Apache Spark 上協作建立機器學習解決方案時,請使用 Databricks。
項目 | 描述 |
---|---|
類型 | 以 Apache Spark 為基礎的分析平台 |
支援的語言 | Python、R、Scala、SQL |
機器學習階段 | 資料準備 資料前置處理 模型訓練 模型微調 模型推斷 管理 部署 |
主要優點 | 單鍵設定和簡化工作流程以方便使用。 用於共同作業的互動式工作區。 與 Azure 無縫整合。 處理大型數據集和密集計算的延展性。 支援各種語言,並與熱門工具整合。 |
ML.NET
ML.NET 是一個開放原始碼、跨平台的機器學習架構。 借助 ML.NET,您可以建立自訂機器學習解決方案並將其整合到您的 .NET 應用程式中。 ML.NET 與 TensorFlow 和 ONNX 等熱門架構提供不同程度的互通性,用於機器學習和深度學習模型的訓練和評分。 對於訓練影像分類模型等資源密集型工作,您可以利用 Azure 在雲端訓練模型。
當您想要將機器學習解決方案整合到 .NET 應用程式中時,請使用 ML.NET。 您可以選擇用於程式碼優先體驗的 API 和用於低程式碼體驗的模型產生器或 CLI。
項目 | 描述 |
---|---|
類型 | 開放原始碼跨平台架構,用於使用 .NET 開發自訂機器學習應用程式 |
支援的語言 | C#、F# |
機器學習階段 | 資料準備 訓練 部署 |
主要優點 | 不需要資料科學和機器學習經驗 使用熟悉的工具 (Visual Studio、Microsoft Visual Studio Code) 和語言 在 .NET 運作的地方部署 可延伸 可調整 本機優先體驗 適用於自動化機器學習工作的 AutoML |
Windows AI
Windows AI Windows AI 是一個強大的平臺,可將人工智慧功能整合到 Windows 應用程式中,使用 Windows 機器學習 (WinML) 和 Direct 機器學習 (DirectML) 的優勢,提供本機、即時的 AI 模型評估和硬體加速。 WinML 可讓開發人員將定型的機器學習模型直接整合到其 Windows 應用程式中。 其可促進模型的本機實時評估,而不需要雲端連線,即可啟用強大的 AI 功能。
DirectML 是高效能、硬體加速的平臺,可用於執行機器學習模型。 它利用 DirectX API,在各種硬體上提供優化的效能,包括 GPU 和 AI 加速器。
當您想要在 Windows 應用程式中使用定型的機器學習模型時,請使用 Windows AI。
項目 | 描述 |
---|---|
類型 | Windows 裝置中經過訓練的模型的推斷引擎 |
機器學習階段 | 資料準備 模型訓練 部署 |
支援的語言 | C#/C++、JavaScript |
主要優點 | 本機即時 AI 模型評估 跨各種硬體類型實現高效能 AI 處理,包括 CPU、GPU 和 AI 加速器 確保不同 Windows 硬體的行為和效能一致。 |
SynapseML
SynapseML (以前稱為 MMLSpark) 是一個開放原始碼程式庫,可簡化大規模可擴展機器學習管線的建立。 SynapseML 為各種不同的機器學習工作提供 API,例如文字分析、視覺、異常偵測等。 SynapseML 建立在 Apache Spark 分散式計算架構之上,並與 SparkML/MLLib 庫共用相同的 API,可讓您將 SynapseML 模型無縫嵌入到現有的 Apache Spark 工作流程中。
SynapseML 為 Spark 生態系統新增了許多深度學習和資料科學工具,包括 Spark 機器學習管線與 Light Gradient Boosting Machine (LightGBM)、LIME (模型可解釋性) 和 OpenCV 的無縫整合。 您可以使用這些工具在任何 Spark 叢集 (例如 Azure Databricks 或 Cosmic Spark) 上建立強大的預測模型。
SynapseML 也為 Spark 生態系統帶來了網路功能。 透過 Spark 專案上的 HTTP,使用者可以將任何 Web 服務嵌入到他們的 SparkML 模型中。 此外,SynapseML 還提供了易於使用的工具,用於大規模協調 Azure AI 服務。 對於生產級部署,Spark Serving 專案可在 Spark 叢集的支援下實現高輸送量、低於毫秒等級延遲的 Web 服務。
項目 | 描述 |
---|---|
類型 | 適用於 Apache Spark 的開放原始碼分散式機器學習和微服務架構 |
支援的語言 | Scala、Java、Python、R 和 .NET |
機器學習階段 | 資料準備 模型訓練 部署 |
主要優點 | 延展性 串流媒體+服務相容 容錯性 |
考量 | 需要 Apache Spark |
參與者
本文由 Microsoft 維護。 原始投稿人如下。
主要作者:
- Mahdi Setayesh |首席軟體工程師
下一步
- 瞭解Microsoft提供的所有人工智慧 (AI) 開發產品: Microsoft AI 平臺。
- 使用Microsoft取得開發 AI 和 機器學習 解決方案的訓練:Microsoft Learn 訓練。
- 深入瞭解 Microsoft Fabric: Microsoft Fabric。
- 探索 Azure AI 服務: Azure AI 服務。
- 探索 Azure 機器學習:Azure 機器學習。
- 瞭解 Azure Databricks: Azure Databricks。
- 探索 Azure Synapse Analytics: Azure Synapse Analytics。
- 探索 Azure SQL 受控執行個體 機器學習 服務:Azure SQL 受控執行個體 機器學習 服務。