Sdílet prostřednictvím


Koncový bod odvozování modelů ve službách Azure AI

Odvozování modelů Azure AI ve službách Azure AI umožňuje zákazníkům využívat nejvýkonnější modely od hlavních poskytovatelů modelů pomocí jednoho koncového bodu a přihlašovacích údajů. To znamená, že můžete přepínat mezi modely a využívat je z aplikace beze změny jednoho řádku kódu.

Tento článek vysvětluje, jak jsou modely uspořádány uvnitř služby a jak je pomocí koncového bodu odvozování vyvolat.

Nasazení

Odvozování modelů Azure AI zpřístupňuje modely s využitím konceptu nasazení . Nasazení představují způsob, jak model pojmenovat v určitých konfiguracích. Tuto konfiguraci modelu pak můžete vyvolat tak, že u vašich požadavků označíte její název.

Zachytávání nasazení:

  • Název modelu
  • Verze modelu
  • Typ zřizování nebo kapacity1
  • Konfiguracefiltrování obsahu 1
  • Konfiguraceomezování rychlosti 1

1 Konfigurace se mohou lišit v závislosti na vybraném modelu.

Prostředek služeb Azure AI může mít tolik nasazení modelů, kolik je potřeba, a neúčtují se za ně náklady, pokud se pro tyto modely neprovádí odvození. Nasazení jsou prostředky Azure, a proto podléhají zásadám Azure.

Další informace o vytváření nasazení najdete v tématu Přidání a konfigurace nasazení modelu.

Koncový bod odvození Azure AI

Koncový bod odvozování Azure AI umožňuje zákazníkům použít jeden koncový bod se stejným ověřováním a schématem k vygenerování odvozování pro nasazené modely v prostředku. Tento koncový bod se řídí rozhraním API pro odvozování modelů Azure AI, které podporují odvozování všech modelů v modelu Azure AI. Podporuje následující modalidity:

  • Vkládání textu
  • Vkládání obrázků
  • Dokončení chatu

Adresu URL koncového bodu a přihlašovací údaje můžete zobrazit v části Přehled :

Snímek obrazovky znázorňující, jak získat adresu URL a klíč přidružený k prostředku

Směrování

Koncový bod odvozování směruje požadavky na dané nasazení tím, že odpovídá parametru name uvnitř požadavku s názvem nasazení. To znamená, že nasazení fungují jako alias daného modelu v určitých konfiguracích. Tato flexibilita umožňuje nasadit daný model ve službě několikrát, ale v případě potřeby v různých konfiguracích.

Obrázek znázorňující, jak funguje směrování pro model Meta-llama-3.2-8b-instruct, který označuje takový název v parametru

Pokud například vytvoříte nasazení s názvem Mistral-large, může být takové nasazení vyvoláno takto:

Nainstalujte balíček azure-ai-inference pomocí správce balíčků, například pip:

pip install azure-ai-inference>=1.0.0b5

Upozorňující

Prostředek Azure AI Services vyžaduje verzi azure-ai-inference>=1.0.0b5 pythonu.

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential

model = ChatCompletionsClient(
    endpoint="https://<resource>.services.ai.azure.com/models",
    credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

from azure.ai.inference.models import SystemMessage, UserMessage

response = client.complete(
    messages=[
        SystemMessage(content="You are a helpful assistant."),
        UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
    ],
    model="mistral-large"
)

print(response.choices[0].message.content)

Tip

Směrování nasazení nerozlišuje malá a velká písmena.

Sady SDK

Koncový bod odvozování modelů Azure AI je podporovaný několika sadami SDK, včetně sady Azure AI Inference SDK, sady Azure AI Foundry SDK a sady Azure OpenAI SDK, které jsou dostupné v několika jazycích. V oblíbených architekturách, jako jsou LangChain, LangGraph, Llama-Index, Sémantické jádro a AG2, se také podporuje více integrací. Podrobnosti najdete v podporovaných programovacích jazycích a sadách SDK .

Koncový bod odvození Azure OpenAI

Modely Azure OpenAI nasazené do služeb AI podporují také rozhraní API Azure OpenAI. Toto rozhraní API zpřístupňuje všechny funkce modelů OpenAI a podporuje další funkce, jako jsou asistenti, vlákna, soubory a dávkové odvozování.

Koncové body odvozování Azure OpenAI fungují na úrovni nasazení a mají vlastní adresu URL, která je přidružená k jednotlivým z nich. Stejný mechanismus ověřování je však možné použít k jejich využití. Další informace najdete na referenční stránce pro rozhraní API Azure OpenAI.

Obrázek znázorňující, jak nasazení Azure OpenAI obsahují jednu adresu URL pro každé nasazení

Každé nasazení má adresu URL, která je zřetězením základní adresy URL Azure OpenAI a trasy /deployments/<model-deployment-name>.

Důležité

Pro koncový bod Azure OpenAI neexistuje žádný mechanismus směrování, protože každá adresa URL je výhradní pro každé nasazení modelu.

Sady SDK

Koncový bod Azure OpenAI podporuje sada OpenAI SDK (AzureOpenAI třída) a sady SDK Azure OpenAI, které jsou k dispozici v několika jazycích. Podrobnosti najdete v podporovaných jazycích .

Další kroky