什麼是 Azure AI 模型推斷服務?
Azure AI 模型推斷服務可讓您存取 Azure AI 模型目錄中可用的最強大模型。 來自業界的主要模型提供者,包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs;這些模型可以與軟體解決方案整合,以提供廣泛的工作,包括內容產生、摘要、影像了解、語意搜尋和程式代碼產生。
Azure AI 模型推斷服務提供一種方式來 取用模型作為 API,而不需要將它們裝載在您的基礎結構上。 模型會裝載於 Microsoft 管理的基礎結構中,以便對模型提供者的模型進行 API 型存取。 API 型存取可大幅降低存取模型的成本,並簡化佈建體驗。
模型
您可以存取業界的主要模型提供者,包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 模型提供者會為其模型定義授權條款並設定使用的價格。 下列清單顯示所有可用的模型:
模型提供者 | 模型 |
---|---|
AI21 Labs | - AI21-Jamba-1.5-Mini - AI21-Jamba-1.5-Large |
Azure OpenAI | - o1-preview (要求存取) - o1-mini (要求存取) - gpt-4o-mini - gpt-4o - text-embedding-3-small - text-embedding-3-large |
Cohere | - Cohere-command-r-plus-08-2024 - Cohere-command-r-08-2024 - Cohere-embed-v3-多語系 - Cohere-embed-v3-english - Cohere-command-r-plus - Cohere-command-r |
Meta AI | - Meta-Llama-3-8B-指示 - Meta-Llama-3-70b-指示 - Meta-Llama-3.1-8B-指示 - Meta-Llama-3.1-70B-指示 - Meta-Llama-3.1-405B-指示 - Llama-3.2-11B-Vision-指示 - Llama-3.2-90B-Vision-指示 |
Mistral AI | - Mistral-Small - Mistral-Nemo - Mistral-large - Mistral-large-2407 |
Microsoft | - Phi-3-mini-4k- 指示 - Phi-3-medium-4k-指示 - Phi-3-mini-128k-指示 - Phi-3-medium-128k- 指示 - Phi-3 -small-8k-instruct - Phi-3-small-128k-instruct - Phi-3.5-vision-指示 - Phi-3.5-mini-指示 - Phi-3.5-MoE-指示 |
您可以 決定和設定可在建立的資源中推斷 哪些模型。 設定指定的模型時,您就可以在要求上指出其模型名稱或部署名稱,從中產生預測。 您的程式代碼不需要進一步變更即可使用它。
若要瞭解如何將模型新增至 Azure AI 模型推斷資源,並使用它們,請參閱 在 Azure AI 模型推斷中將模型新增和設定至 Azure AI 模型。
定價
非Microsoft提供者所提供的模型(例如 Meta AI 和 Mistral 模型)會透過 Azure Marketplace 計費。 針對這類模型,您必須根據 Microsoft商業市集使用規定訂閱特定模型供應專案。 使用者接受使用模型時所要遵守的授權條款。 在部署期間會提供取用定價資訊。
Microsoft所提供的模型(例如 Phi-3 模型和 Azure OpenAI 模型)沒有這項需求,而且會透過 Azure 計量作為第一方取用服務來計費。 如產品條款所述,可以使用 Azure 計量購買第一方取用服務,但不受 Azure 服務條款的約束。