Koncový bod odvozování modelů ve službách Azure AI
Odvozování modelů Azure AI ve službách Azure AI umožňuje zákazníkům využívat nejvýkonnější modely od hlavních poskytovatelů modelů pomocí jednoho koncového bodu a přihlašovacích údajů. To znamená, že můžete přepínat mezi modely a využívat je z aplikace beze změny jednoho řádku kódu.
Tento článek vysvětluje, jak jsou modely uspořádány uvnitř služby a jak je pomocí koncového bodu odvozování vyvolat.
Nasazení
Odvozování modelů Azure AI zpřístupňuje modely s využitím konceptu nasazení . Nasazení představují způsob, jak model pojmenovat v určitých konfiguracích. Tuto konfiguraci modelu pak můžete vyvolat tak, že u vašich požadavků označíte její název.
Zachytávání nasazení:
- Název modelu
- Verze modelu
- Typ zřizování nebo kapacity1
- Konfiguracefiltrování obsahu 1
- Konfiguraceomezování rychlosti 1
1 Konfigurace se mohou lišit v závislosti na vybraném modelu.
Prostředek služeb Azure AI může mít tolik nasazení modelů, kolik je potřeba, a neúčtují se za ně náklady, pokud se pro tyto modely neprovádí odvození. Nasazení jsou prostředky Azure, a proto podléhají zásadám Azure.
Další informace o vytváření nasazení najdete v tématu Přidání a konfigurace nasazení modelu.
Koncový bod odvození Azure AI
Koncový bod odvozování Azure AI umožňuje zákazníkům použít jeden koncový bod se stejným ověřováním a schématem k vygenerování odvozování pro nasazené modely v prostředku. Tento koncový bod se řídí rozhraním API pro odvozování modelů Azure AI, které podporují odvozování všech modelů v modelu Azure AI. Podporuje následující modalidity:
- Vkládání textu
- Vkládání obrázků
- Dokončení chatu
Adresu URL koncového bodu a přihlašovací údaje můžete zobrazit v části Přehled :
Směrování
Koncový bod odvozování směruje požadavky na dané nasazení tím, že odpovídá parametru name
uvnitř požadavku s názvem nasazení. To znamená, že nasazení fungují jako alias daného modelu v určitých konfiguracích. Tato flexibilita umožňuje nasadit daný model ve službě několikrát, ale v případě potřeby v různých konfiguracích.
Pokud například vytvoříte nasazení s názvem Mistral-large
, může být takové nasazení vyvoláno takto:
Nainstalujte balíček azure-ai-inference
pomocí správce balíčků, například pip:
pip install azure-ai-inference>=1.0.0b5
Upozorňující
Prostředek Azure AI Services vyžaduje verzi azure-ai-inference>=1.0.0b5
pythonu.
Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential
model = ChatCompletionsClient(
endpoint="https://<resource>.services.ai.azure.com/models",
credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)
Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.
from azure.ai.inference.models import SystemMessage, UserMessage
response = client.complete(
messages=[
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
],
model="mistral-large"
)
print(response.choices[0].message.content)
Tip
Směrování nasazení nerozlišuje malá a velká písmena.
Sady SDK
Koncový bod odvozování modelů Azure AI je podporovaný několika sadami SDK, včetně sady Azure AI Inference SDK, sady Azure AI Foundry SDK a sady Azure OpenAI SDK, které jsou dostupné v několika jazycích. V oblíbených architekturách, jako jsou LangChain, LangGraph, Llama-Index, Sémantické jádro a AG2, se také podporuje více integrací. Podrobnosti najdete v podporovaných programovacích jazycích a sadách SDK .
Koncový bod odvození Azure OpenAI
Modely Azure OpenAI nasazené do služeb AI podporují také rozhraní API Azure OpenAI. Toto rozhraní API zpřístupňuje všechny funkce modelů OpenAI a podporuje další funkce, jako jsou asistenti, vlákna, soubory a dávkové odvozování.
Koncové body odvozování Azure OpenAI fungují na úrovni nasazení a mají vlastní adresu URL, která je přidružená k jednotlivým z nich. Stejný mechanismus ověřování je však možné použít k jejich využití. Další informace najdete na referenční stránce pro rozhraní API Azure OpenAI.
Každé nasazení má adresu URL, která je zřetězením základní adresy URL Azure OpenAI a trasy /deployments/<model-deployment-name>
.
Důležité
Pro koncový bod Azure OpenAI neexistuje žádný mechanismus směrování, protože každá adresa URL je výhradní pro každé nasazení modelu.
Sady SDK
Koncový bod Azure OpenAI podporuje sada OpenAI SDK (AzureOpenAI
třída) a sady SDK Azure OpenAI, které jsou k dispozici v několika jazycích. Podrobnosti najdete v podporovaných jazycích .