將模型新增和設定至 Azure AI 服務 - Azure AI Foundry

重要

本文中標示為 (預覽) 的項目目前處於公開預覽狀態。此預覽版本沒有服務等級協定，不建議將其用於生產工作負載。可能不支援特定功能，或可能已經限制功能。如需詳細資訊，請參閱 Microsoft Azure 預覽版增補使用條款。

您可以決定並設定哪些模型可用於推斷端點中的推斷。設定指定的模型時，您就可以在要求上指出其模型名稱或部署名稱，從中產生預測。您的程式代碼不需要進一步變更即可使用它。

在本文中，您將瞭解如何在 Azure AI Foundry 中將新的模型新增至 Azure AI 模型推斷。

必要條件

若要完成本文，您需要：

Azure 訂用帳戶。如果您使用 GitHub Models，您可以升級您的體驗，並在程式中建立 Azure 訂用帳戶。如果您的情況，請閱讀從 GitHub 模型升級至 Azure AI 模型推斷。
Azure AI 服務資源。

使用將模型部署至 Azure AI 模型推斷服務的功能，連線到 Azure AI 服務資源的 AI 專案。
- 您可以遵循在 Azure AI Foundry 項目中設定 Azure AI 模型推斷服務中的步驟。

新增模型

您可以使用下列步驟，將模型新增至 Azure AI 模型推斷端點：

移至 Azure AI Foundry 入口網站中的 [模型目錄] 區段。
捲動至您感興趣的模型，然後加以選取。
您可以在模型卡片中檢閱模型的詳細數據。
選取 [部署]。
對於需要更多合約條款的模型提供者，系統會要求您接受這些條款。例如，這是Mistral模型的情況。選取 [訂閱並部署]，以接受這些案例的條款。
此時您可以設定部署設定。根據預設，部署會接收您要部署的模型名稱。部署名稱用於參數中 model ，要求路由至此特定模型部署。這可讓您在附加特定組態時，為模型設定特定名稱。例如 o1-preview-safe ，具有嚴格內容安全性內容篩選的模型。

提示

每個模型都可以支援不同的部署類型，以提供不同的數據落地或輸送量保證。如需詳細資訊，請參閱部署類型。
我們會根據您的項目自動選取 Azure AI Services 連線。使用 [ 自定義] 選項，根據您的需求變更連線。如果您要在標準部署類型下部署，模型必須在 Azure AI 服務資源的區域中提供。

提示

如果未列出所需的資源，您可能需要建立與其連線。請參閱在 Azure AI Foundry 入口網站中的項目中設定 Azure AI 模型推斷服務。
選取 [部署]。
部署完成之後，新的模型就會列在頁面中，並準備好使用。

管理模型

您可以使用 Azure AI Foundry 入口網站來管理資源中的現有模型部署。

移至 Azure AI Foundry 入口網站中的 [模型 + 端點] 區段。
捲動至 Azure AI Services 資源的連線。模型部署會分組並顯示每個連線。
您會看到每個連線下可用的模型清單。選取您感興趣的模型部署。
視需要編輯或刪除部署。

在遊樂場中測試部署

您可以使用遊樂場與 Azure AI Foundry 入口網站中的新模型互動：

注意

只有在使用 Azure AI Foundry 中的 AI 專案時，才能使用遊樂場。建立 AI 專案，以取得 Azure AI Foundry 中所有功能的完整存取權。

移至 Azure AI Foundry 入口網站中的 [遊樂場] 區段。
根據您部署的模型類型，選取所需的遊樂場。在此案例中，我們選取 [聊天遊樂場]。
在 [部署] 下拉式清單中，選取您建立的模型部署名稱。
輸入您的提示，並查看輸出。
此外，您可以使用 檢視程序代碼 ，以程式設計方式查看如何存取模型部署的詳細數據。

重要

本文中標示為 (預覽) 的項目目前處於公開預覽狀態。此預覽版本沒有服務等級協定，不建議將其用於生產工作負載。可能不支援特定功能，或可能已經限制功能。如需詳細資訊，請參閱 Microsoft Azure 預覽版增補使用條款。

您可以決定並設定哪些模型可用於推斷端點中的推斷。設定指定的模型時，您就可以在要求上指出其模型名稱或部署名稱，從中產生預測。您的程式代碼不需要進一步變更即可使用它。

在本文中，您將瞭解如何在 Azure AI Foundry 中將新的模型新增至 Azure AI 模型推斷。

必要條件

若要完成本文，您需要：

Azure 訂用帳戶。如果您使用 GitHub Models，您可以升級您的體驗，並在程式中建立 Azure 訂用帳戶。如果您的情況，請閱讀從 GitHub 模型升級至 Azure AI 模型推斷。
Azure AI 服務資源。

安裝 Azure CLI 和cognitiveservices適用於 Azure AI 服務的擴充功能：
```
az extension add -n cognitiveservices
```
本教學課程中的某些命令會使用 jq 工具，而此工具可能未安裝在您的系統中。如需安裝指示，請參閱下載 jq。
識別下列資訊：
- 您的 Azure 訂用帳戶識別碼。
- 您的 Azure AI 服務資源名稱。
- 部署 Azure AI 服務資源的資源群組。

加入模型

若要新增模型，您必須先識別要部署的模型。您可以查詢可用的模型，如下所示：

登入您的 Azure 訂用帳戶：
```
az login
```
如果您有 1 個以上的訂用帳戶，請選取資源所在的訂用帳戶：
```
az account set --subscription $subscriptionId>
```
使用您計劃使用的 Azure AI 服務資源名稱和資源群組，設定下列環境變數。
```
accountName="<ai-services-resource-name>"
resourceGroupName="<resource-group>"
```

如果您尚未建立 Azure AI 服務帳戶，您可以建立一個帳戶，如下所示：

az cognitiveservices account create -n $accountName -g $resourceGroupName --custom-domain $accountName

讓我們先看看哪些模型可供您使用，以及哪些 SKU。下列命令會列出所有可用的模型定義：

az cognitiveservices account list-models \
    -n $accountName \
    -g $resourceGroupName \
| jq '.[] | { name: .name, format: .format, version: .version, sku: .skus[0].name, capacity: .skus[0].capacity.default }'

輸出如下所示：

{
  "name": "Phi-3.5-vision-instruct",
  "format": "Microsoft",
  "version": "2",
  "sku": "GlobalStandard",
  "capacity": 1
}

識別您想要部署的模型。您需要屬性 name、 format、 version與 sku。視部署類型而定，可能需要容量。

提示

請注意，並非所有模型都可在所有 SKU 中使用。

將模型部署新增至資源。下列範例會新增 Phi-3.5-vision-instruct：

az cognitiveservices account deployment create \
    -n $accountName \
    -g $resourceGroupName \
    --deployment-name Phi-3.5-vision-instruct \
    --model-name Phi-3.5-vision-instruct \
    --model-version 2 \
    --model-format Microsoft \
    --sku-capacity 1 \
    --sku-name GlobalStandard

模型已準備好取用。

您可以視需要多次部署相同的模型，只要它是在不同的部署名稱下即可。如果您想要測試指定模型的不同組態，包括內容安全性，這項功能可能會很有用。

管理部署

您可以使用 CLI 檢視所有可用的部署：

執行下列命令以檢視所有作用中的部署：

az cognitiveservices account deployment list -n $accountName -g $resourceGroupName

您可以看到指定部署的詳細資料：

az cognitiveservices account deployment show \
    --deployment-name "Phi-3.5-vision-instruct" \
    -n $accountName \
    -g $resourceGroupName

您可以刪除指定的部署，如下所示：

    az cognitiveservices account deployment delete \
    --deployment-name "Phi-3.5-vision-instruct" \
    -n $accountName \
    -g $resourceGroupName

使用模型

您可以使用 Azure AI 模型的推斷端點來取用 Azure AI 模型推斷中的模型。建構要求時，請指出參數 model ，並插入您已建立的模型部署名稱。您可以使用下列程式代碼，以程式設計方式取得推斷端點的 URI：

推斷端點

az cognitiveservices account show  -n $accountName -g $resourceGroupName | jq '.properties.endpoints["Azure AI Model Inference API"]'

若要對 Azure AI 模型推斷端點提出要求，請附加路由 models，例如 https://<resource>.services.ai.azure.com/models。您可以在 Azure AI 模型推斷 API 參考頁面看到端點的 API 參考。

推斷索引鍵

az cognitiveservices account keys list  -n $accountName -g $resourceGroupName

重要

本文中標示為 (預覽) 的項目目前處於公開預覽狀態。此預覽版本沒有服務等級協定，不建議將其用於生產工作負載。可能不支援特定功能，或可能已經限制功能。如需詳細資訊，請參閱 Microsoft Azure 預覽版增補使用條款。

您可以決定並設定哪些模型可用於推斷端點中的推斷。設定指定的模型時，您就可以在要求上指出其模型名稱或部署名稱，從中產生預測。您的程式代碼不需要進一步變更即可使用它。

在本文中，您將瞭解如何在 Azure AI Foundry 中將新的模型新增至 Azure AI 模型推斷。

必要條件

若要完成本文，您需要：

Azure 訂用帳戶。如果您使用 GitHub Models，您可以升級您的體驗，並在程式中建立 Azure 訂用帳戶。如果您的情況，請閱讀從 GitHub 模型升級至 Azure AI 模型推斷。
Azure AI 服務資源。

安裝 Azure CLI。
識別下列資訊：
- 您的 Azure 訂用帳戶識別碼。
- 您的 Azure AI 服務資源名稱。
- 部署 Azure AI 服務資源的資源群組。
- 您想要部署的模型名稱、提供者、版本和 SKU。您可以使用 Azure AI Foundry 入口網站或 Azure CLI 來識別它。在此範例中，我們會部署下列模型：
  - 模型名稱：： Phi-3.5-vision-instruct
  - 提供者： Microsoft
  - 版本：2
  - 部署類型：全域標準

關於本教學課程

本文中的範例是以 Azure-Samples/azureai-model-inference-bicep 存放庫中所包含的程式代碼範例為基礎。若要在本機執行命令，而不需要複製或貼上檔案內容，請使用下列命令來複製存放庫，並移至您程式代碼撰寫語言的資料夾：

git clone https://github.com/Azure-Samples/azureai-model-inference-bicep

此範例的檔案位於：

cd azureai-model-inference-bicep/infra

新增模型

使用樣本 ai-services-deployment-template.bicep 來描述模型部署：

ai-services-deployment-template.bicep

@description('Name of the Azure AI services account')
param accountName string

@description('Name of the model to deploy')
param modelName string

@description('Version of the model to deploy')
param modelVersion string

@allowed([
  'AI21 Labs'
  'Cohere'
  'Core42'
  'DeepSeek'
  'Meta'
  'Microsoft'
  'Mistral AI'
  'OpenAI'
])
@description('Model provider')
param modelPublisherFormat string

@allowed([
    'GlobalStandard'
    'Standard'
    'GlobalProvisioned'
    'Provisioned'
])
@description('Model deployment SKU name')
param skuName string = 'GlobalStandard'

@description('Content filter policy name')
param contentFilterPolicyName string = 'Microsoft.DefaultV2'

@description('Model deployment capacity')
param capacity int = 1

resource modelDeployment 'Microsoft.CognitiveServices/accounts/deployments@2024-04-01-preview' = {
  name: '${accountName}/${modelName}'
  sku: {
    name: skuName
    capacity: capacity
  }
  properties: {
    model: {
      format: modelPublisherFormat
      name: modelName
      version: modelVersion
    }
    raiPolicyName: contentFilterPolicyName == null ? 'Microsoft.Nill' : contentFilterPolicyName
  }
}

執行部署：

RESOURCE_GROUP="<resource-group-name>"
ACCOUNT_NAME="<azure-ai-model-inference-name>" 
MODEL_NAME="Phi-3.5-vision-instruct"
PROVIDER="Microsoft"
VERSION=2

az deployment group create \
    --resource-group $RESOURCE_GROUP \
    --template-file ai-services-deployment-template.bicep \
    --parameters accountName=$ACCOUNT_NAME modelName=$MODEL_NAME modelVersion=$VERSION modelPublisherFormat=$PROVIDER

使用模型

您可以使用 Azure AI 模型的推斷端點來取用 Azure AI 模型推斷中的模型。建構要求時，請指出參數 model ，並插入您已建立的模型部署名稱。

共用方式為

將模型新增和設定至 Azure AI 模型推斷

必要條件

新增模型

管理模型

在遊樂場中測試部署

必要條件

加入模型

管理部署

使用模型

必要條件

關於本教學課程

新增模型

使用模型

下一步

意見反應

其他資源