Využití modelů pomocí koncového bodu odvozování modelů Azure AI

Článek
02/25/2025

Odvozování modelů Azure AI ve službách Azure AI umožňuje zákazníkům využívat nejvýkonnější modely od hlavních poskytovatelů modelů pomocí jednoho koncového bodu a přihlašovacích údajů. To znamená, že můžete přepínat mezi modely a využívat je z aplikace beze změny jednoho řádku kódu.

Tento článek vysvětluje, jak k jejich vyvolání použít koncový bod odvození.

Koncové body

Služby Azure AI zveřejňují více koncových bodů v závislosti na typu práce, kterou hledáte:

Koncový bod odvozování modelu Azure AI
Koncový bod Azure OpenAI

Koncový bod odvozování Azure AI (obvykle s formulářem https://<resource-name>.services.ai.azure.com/models) umožňuje zákazníkům použít jeden koncový bod se stejným ověřováním a schématem k vygenerování odvozování pro nasazené modely v prostředku. Tuto funkci podporují všechny modely. Tento koncový bod se řídí rozhraním API pro odvozování modelů Azure AI.

Modely Azure OpenAI nasazené do služeb AI podporují také rozhraní API Azure OpenAI (obvykle s formulářem https://<resource-name>.openai.azure.com). Tento koncový bod zveřejňuje všechny funkce modelů OpenAI a podporuje další funkce, jako jsou asistenti, vlákna, soubory a dávkové odvozování.

Další informace o použití koncového bodu Azure OpenAI najdete v dokumentaci ke službě Azure OpenAI.

Použití možnosti směrování v koncovém bodu odvozování modelu Azure AI

Koncový bod odvozování směruje požadavky na dané nasazení tím, že odpovídá parametru name uvnitř požadavku s názvem nasazení. To znamená, že nasazení fungují jako alias daného modelu v určitých konfiguracích. Tato flexibilita umožňuje nasadit daný model ve službě několikrát, ale v případě potřeby v různých konfiguracích.

Pokud například vytvoříte nasazení s názvem Mistral-large, může být takové nasazení vyvoláno takto:

Nainstalujte balíček azure-ai-inference pomocí správce balíčků, například pip:

pip install azure-ai-inference

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential

model = ChatCompletionsClient(
    endpoint="https://<resource>.services.ai.azure.com/models",
    credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

Nainstalujte balíček @azure-rest/ai-inference pomocí npm:

npm install @azure-rest/ai-inference

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

import ModelClient from "@azure-rest/ai-inference";
import { isUnexpected } from "@azure-rest/ai-inference";
import { AzureKeyCredential } from "@azure/core-auth";

const client = new ModelClient(
    "https://<resource>.services.ai.azure.com/models", 
    new AzureKeyCredential(process.env.AZUREAI_ENDPOINT_KEY)
);

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

Pomocí následujícího příkazu nainstalujte knihovnu pro odvození Azure AI:

dotnet add package Azure.AI.Inference --prerelease

Naimportujte následující obory názvů:

using Azure;
using Azure.Identity;
using Azure.AI.Inference;

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

ChatCompletionsClient client = new ChatCompletionsClient(
    new Uri("https://<resource>.services.ai.azure.com/models"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("AZURE_INFERENCE_CREDENTIAL"))
);

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

Přidejte balíček do projektu:

<dependency>
    <groupId>com.azure</groupId>
    <artifactId>azure-ai-inference</artifactId>
    <version>1.0.0-beta.1</version>
</dependency>

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

ChatCompletionsClient client = new ChatCompletionsClientBuilder()
    .credential(new AzureKeyCredential("{key}"))
    .endpoint("{endpoint}")
    .buildClient();

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

V referenční části se seznámíte s návrhem rozhraní API a s dostupnými parametry. Například referenční část pro dokončování chatu podrobně popisuje, jak použít trasu /chat/completions ke generování předpovědí na základě pokynů naformátovaných chatem. Všimněte si, že cesta /models je zahrnutá do kořenového adresáře adresy URL:

Požádat

POST https://<resource>.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
api-key: <api-key>
Content-Type: application/json

Pro model chatu můžete vytvořit žádost následujícím způsobem:

from azure.ai.inference.models import SystemMessage, UserMessage

response = client.complete(
    messages=[
        SystemMessage(content="You are a helpful assistant."),
        UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
    ],
    model="mistral-large"
)

print(response.choices[0].message.content)

var messages = [
    { role: "system", content: "You are a helpful assistant" },
    { role: "user", content: "Explain Riemann's conjecture in 1 paragraph" },
];

var response = await client.path("/chat/completions").post({
    body: {
        messages: messages,
        model: "mistral-large"
    }
});

console.log(response.choices[0].message.content)

requestOptions = new ChatCompletionsOptions()
{
    Messages = {
        new ChatRequestSystemMessage("You are a helpful assistant."),
        new ChatRequestUserMessage("Explain Riemann's conjecture in 1 paragraph")
    },
    Model = "mistral-large"
};

response = client.Complete(requestOptions);
Console.WriteLine($"Response: {response.Value.Content}");

List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant"));
chatMessages.add(new ChatRequestUserMessage("Explain Riemann's conjecture in 1 paragraph"));

ChatCompletions chatCompletions = client.complete(new ChatCompletionsOptions(chatMessages));

for (ChatChoice choice : chatCompletions.getChoices()) {
    ChatResponseMessage message = choice.getMessage();
    System.out.println("Response:" + message.getContent());
}

Požádat

POST https://<resource>.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
api-key: <api-key>
Content-Type: application/json

{
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant"
        },
        {
            "role": "user",
            "content": "Explain Riemann's conjecture in 1 paragraph"
        }
    ],
    "model": "mistral-large"
}

Pokud zadáte název modelu, který neodpovídá žádnému danému nasazení modelu, zobrazí se chyba, že model neexistuje. To, které modely jsou uživatelům k dispozici, můžete řídit tak, že vytvoříte nasazení modelů, jak je vysvětleno při přidávání a konfiguraci nasazení modelu.

Ověřování bez klíčů

Modely nasazené do odvozování modelů Azure AI ve službách Azure AI podporují autorizaci bez klíčů pomocí ID Microsoft Entra. Autorizace bez klíčů zvyšuje zabezpečení, zjednodušuje uživatelské prostředí, snižuje provozní složitost a poskytuje robustní podporu dodržování předpisů pro moderní vývoj. Je to silná volba pro organizace, které přijímají zabezpečená a škálovatelná řešení pro správu identit.

Pokud chcete použít ověřování bez klíče, nakonfigurujte prostředek a udělte uživatelům přístup k odvozování. Po nakonfigurování se pak můžete ověřit následujícím způsobem:

Nainstalujte balíček azure-ai-inference pomocí správce balíčků, například pip:

pip install azure-ai-inference

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta, který bude využívat dokončování chatu s ID Entra:

import os
from azure.ai.inference import ChatCompletionsClient
from azure.identity import DefaultAzureCredential

client = ChatCompletionsClient(
    endpoint="https://<resource>.services.ai.azure.com/models",
    credential=DefaultAzureCredential(),
    credential_scopes=["https://cognitiveservices.azure.com/.default"],
)

Nainstalujte balíček @azure-rest/ai-inference pomocí npm:

npm install @azure-rest/ai-inference

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta, který bude využívat dokončování chatu s ID Entra:

import ModelClient from "@azure-rest/ai-inference";
import { isUnexpected } from "@azure-rest/ai-inference";
import { DefaultAzureCredential } from "@azure/identity";

const clientOptions = { credentials: { "https://cognitiveservices.azure.com" } };

const client = new ModelClient(
    "https://<resource>.services.ai.azure.com/models", 
    new DefaultAzureCredential(),
    clientOptions,
);

Pomocí následujícího příkazu nainstalujte knihovnu pro odvození Azure AI:

dotnet add package Azure.AI.Inference --prerelease

Azure.Identity Nainstalujte balíček:

dotnet add package Azure.Identity

Naimportujte následující obory názvů:

using Azure;
using Azure.Identity;
using Azure.AI.Inference;

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta, který bude využívat dokončování chatu s ID Entra:

TokenCredential credential = new DefaultAzureCredential();
AzureAIInferenceClientOptions clientOptions = new AzureAIInferenceClientOptions();
BearerTokenAuthenticationPolicy tokenPolicy = new BearerTokenAuthenticationPolicy(credential, new string[] { "https://cognitiveservices.azure.com/.default" });
clientOptions.AddPolicy(tokenPolicy, HttpPipelinePosition.PerRetry);

ChatCompletionsClient client = new ChatCompletionsClient(
    new Uri("https://<resource>.services.ai.azure.com/models"),
    credential,
    clientOptions.
);

Přidejte balíček do projektu:

<dependency>
    <groupId>com.azure</groupId>
    <artifactId>azure-ai-inference</artifactId>
    <version>1.0.0-beta.1</version>
</dependency>
<dependency>
    <groupId>com.azure</groupId>
    <artifactId>azure-identity</artifactId>
    <version>1.13.3</version>
</dependency>

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

TokenCredential defaultCredential = new DefaultAzureCredentialBuilder().build();
ChatCompletionsClient client = new ChatCompletionsClientBuilder()
    .credential(defaultCredential)
    .endpoint("https://<resource>.services.ai.azure.com/models")
    .buildClient();

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

V referenční části se seznámíte s návrhem rozhraní API a s dostupnými parametry a označíte ověřovací token v hlavičce Authorization. Například referenční část pro dokončování chatu podrobně popisuje, jak použít trasu /chat/completions ke generování předpovědí na základě pokynů naformátovaných chatem. Všimněte si, že cesta /models je zahrnutá do kořenového adresáře adresy URL:

Požádat

POST https://<resource>.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
Authorization: Bearer <bearer-token>
Content-Type: application/json

Tokeny musí být vystaveny s rozsahem https://cognitiveservices.azure.com/.default.

Pro účely testování je nejjednodušší způsob, jak získat platný token pro váš uživatelský účet, použít Azure CLI. V konzole spusťte následující příkaz Azure CLI:

az account get-access-token --resource https://cognitiveservices.azure.com --query "accessToken" --output tsv

Omezení

Azure OpenAI Batch se nedá použít s koncovým bodem odvozování modelu Azure AI. Musíte použít vyhrazenou adresu URL nasazení, jak je vysvětleno v podpoře rozhraní API služby Batch v dokumentaci k Azure OpenAI.
V koncovém bodu odvození se nepodporuje rozhraní API v reálném čase. Použijte vyhrazenou adresu URL nasazení.

Sdílet prostřednictvím

Využití modelů pomocí koncového bodu odvozování modelů Azure AI

Koncové body

Použití možnosti směrování v koncovém bodu odvozování modelu Azure AI

Ověřování bez klíčů

Omezení

Další kroky

Váš názor

Další materiály