共用方式為


什麼是 Azure AI 模型推斷?

Azure AI 模型推斷可讓您存取 Azure AI 模型目錄中可用的最強大模型。 這些模型來自業界的主要模型提供者,包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 這些模型可以與軟體解決方案整合,以提供廣泛的工作,包括內容產生、摘要、影像理解、語意搜尋和程式代碼產生。

提示

DeepSeek-R1 可供部署為 無伺服器 API 端點

Azure AI 模型推斷可讓您 使用模型作為 API,而不需要將模型裝載在您的基礎結構上。 模型會裝載於 Microsoft 管理的基礎結構中,以便對模型提供者的模型進行 API 型存取。 API 型存取可大幅降低存取模型的成本,並簡化佈建體驗。

Azure AI 模型推斷是 Azure AI 服務的一部分,使用者可以透過 REST API、數種語言的 SDK,例如 Python、C#、JavaScript 和 Java 來存取服務。 您也可以藉由設定連線,從 Azure AI Foundry 使用 Azure AI 模型推斷。

模型

您可以存取業界的主要模型提供者,包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 模型提供者會為其模型定義授權條款並設定使用的價格。 下列清單顯示所有可用的模型:

提供者 模型
AI21 Labs - AI21-Jamba-1.5-Mini
- AI21-Jamba-1.5-Large
Azure OpenAI - o1
- gpt-4o
- o1-preview
- o1-mini
- gpt-4o-mini
- text-embedding-3-large
- text-embedding-3-small
Cohere - Cohere-embed-v3-english
- Cohere-embed-v3-多語系
- Cohere-command-r-plus-08-2024
- Cohere-command-r-08-2024
- Cohere-command-r-plus
- Cohere-command-r
Core42 - jais-30b-chat
- Llama-3.3-70B-指示
- Llama-3.2-11B-Vision-指示
- Llama-3.2-90B-Vision-指示
- Meta-Llama-3.1-405B-指示
- Meta-Llama-3-8B-指示
- Meta-Llama-3.1-70B-指示
- Meta-Llama-3.1-8B-指示
- Meta-Llama-3-70B-指示
Microsoft - Phi-3-mini-128k-instruct
- Phi-3-mini-4k-指示
- Phi-3-small-8k-instruct
- Phi-3-medium-128k-instruct
- Phi-3-medium-4k-instruct
- Phi-3.5-vision-instruct
- Phi-3.5-MoE-指示
- Phi-3-small-128k-instruct
- Phi-3.5-mini-指示
- Phi-4
Mistral AI - 部長-3B
- Mistral-large
- Mistral-small
- Mistral-Nemo
- Mistral-large-2407
- Mistral-Large-2411
- Codestral-2501
NTT 資料 - Tsuzumi-7b

定價

對於來自非Microsoft提供者的模型(例如 Meta AI 和 Mistral 模型),計費是透過 Azure Marketplace。 針對這類模型,您必須根據 Microsoft商業市集使用規定訂閱特定模型供應專案。 使用者接受使用模型時所要遵守的授權條款。 在部署期間會提供取用定價資訊。

對於Microsoft模型(例如 Phi-3 模型和 Azure OpenAI 模型)計費是透過 Azure 計量作為第一方取用服務。 如產品條款所述,可以使用 Azure 計量購買第一方取用服務,但不受 Azure 服務條款的約束。

負責 AI

Microsoft 承諾 AI 的進展,由以人為先的原則所驅動。 Azure AI 模型中可用的衍生模型具有顯著的潛在優點,但如果沒有仔細的設計和深思熟慮的緩和措施,這類模型就有可能產生不正確甚至有害的內容。

Microsoft採取下列動作,協助防範濫用和意外傷害:

開始使用

Azure AI 模型推斷是 Azure AI 服務資源上的新功能供應專案。 您可以使用與在 Azure 訂用帳戶中為 Azure AI 模型推斷或服務實例建立和設定資源的任何其他 Azure 產品一樣開始使用。 您可以視需要建立任意數量的資源,並獨立設定它們,以防您有多個具有不同需求的小組。

建立 Azure AI 服務資源之後,您必須先部署模型,才能開始進行 API 呼叫。 根據預設,沒有任何模型可供使用,因此您可以控制要從哪個模型開始。 請參閱在 Azure AI 模型推斷中建立您的第一個模型部署教學課程

下一步