Sdílet prostřednictvím


Upgrade z modelů GitHubu na odvození modelu Azure AI

Pokud chcete vyvíjet aplikaci generující AI, můžete pomocí modelů GitHubu zdarma najít a experimentovat s modely AI. Využití dětského hřiště a bezplatného rozhraní API jsou omezené požadavky za minutu, požadavky za den, tokeny na žádost a souběžné žádosti. Pokud získáte omezenou rychlost, musíte počkat na limit rychlosti, který jste dosáhli resetování, a teprve potom můžete provádět další žádosti.

Jakmile budete připraveni přenést aplikaci do produkčního prostředí, můžete prostředí upgradovat nasazením prostředku Azure AI Services v předplatném Azure a začít používat službu odvozování modelů Azure AI. V kódu nemusíte měnit nic jiného.

Následující článek vysvětluje, jak začít s modely GitHubu a nasadit prostředek azure AI Services s odvození modelu Azure AI.

Požadavky

Pro absolvování tohoto kurzu potřebujete:

  • Účet GitHubu s přístupem k modelům GitHub.
  • Předplatné Azure. Pokud ho nemáte, zobrazí se výzva k vytvoření nebo aktualizaci účtu Azure na účet s průběžnými platbou, až budete připraveni nasadit model do produkčního prostředí.

Upgrade na odvození modelu Azure AI

Omezení rychlosti pro dětské hřiště a bezplatné využití rozhraní API jsou určená k tomu, abyste mohli experimentovat s modely a vyvíjet aplikaci AI. Jakmile budete připraveni přenést aplikaci do produkčního prostředí, použijte klíč a koncový bod z placeného účtu Azure. V kódu nemusíte měnit nic jiného.

Získání klíče a koncového bodu:

  1. Přejděte k modelům GitHubu a vyberte model, který vás zajímá.

  2. V dětském prostředí pro váš model vyberte Získat klíč rozhraní API.

  3. Vyberte Získat produkční klíč.

    Animace ukazující, jak upgradovat modely GitHubu, abyste získali prostředek připravený pro produkční prostředí.

  4. Pokud účet Azure nemáte, vyberte Vytvořit můj účet a postupujte podle pokynů k jeho vytvoření.

  5. Pokud máte účet Azure, vyberte Přihlásit se zpět.

  6. Pokud je váš stávající účet bezplatný účet, musíte nejprve upgradovat na plán Průběžné platby. Po upgradu se vraťte do dětského hřiště a znovu vyberte Získat klíč rozhraní API a přihlaste se pomocí upgradovaného účtu.

  7. Jakmile se přihlásíte ke svému účtu Azure, přejdete do Azure AI Studia > na GitHubu. Načtení počátečních podrobností modelu v AI Studiu může trvat jednu nebo dvě minuty.

  8. Stránka se načte s podrobnostmi modelu. Výběrem tlačítka Nasadit nasaďte model do svého účtu.

  9. Po nasazení se v přehledu zobrazí klíč a koncový bod rozhraní API vašeho modelu. Tyto hodnoty v kódu použijte k použití modelu v produkčním prostředí.

V tomto okamžiku je vybraný model připravený k použití.

Upgrade kódu tak, aby používal nový koncový bod

Jakmile je prostředek Azure AI Services nakonfigurovaný, můžete ho začít využívat z kódu. Pokud chcete využívat prostředek azure AI Services, potřebujete adresu URL a klíč koncového bodu, které jsou k dispozici v části Přehled :

Snímek obrazovky znázorňující, jak získat adresu URL a klíč přidružený k prostředku

K získání předpovědí z koncového bodu můžete použít některou z podporovaných sad SDK. Oficiálně se podporují následující sady SDK:

  • OpenAI SDK
  • Azure OpenAI SDK
  • Azure AI Inference SDK

Další podrobnosti a příklady najdete v části Podporované jazyky a sady SDK . Následující příklad ukazuje, jak používat sadu SDK pro odvozování modelu Azure AI s nově nasazeným modelem:

Nainstalujte balíček azure-ai-inference pomocí správce balíčků, například pip:

pip install azure-ai-inference

Pak můžete balíček použít k využívání modelu. Následující příklad ukazuje, jak vytvořit klienta pro zpracování dokončení chatu:

import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential

model = ChatCompletionsClient(
    endpoint="https://<resource>.services.ai.azure.com/models",
    credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)

Projděte si naše ukázky a přečtěte si referenční dokumentaci k rozhraní API, abyste mohli začít.

Vygenerujte první dokončení chatu:

from azure.ai.inference.models import SystemMessage, UserMessage

response = client.complete(
    messages=[
        SystemMessage(content="You are a helpful assistant."),
        UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
    ],
    model="mistral-large"
)

print(response.choices[0].message.content)

Pomocí parametru model="<deployment-name> můžete směrovat požadavek na toto nasazení. Nasazení fungují jako alias daného modelu v určitých konfiguracích. Informace o nasazení směrování služby Azure AI Services najdete na stránce konceptů směrování .

Důležité

Stejně jako u modelů GitHubu, kde jsou už všechny modely nakonfigurované, vám prostředek Azure AI Services umožňuje řídit, které modely jsou dostupné ve vašem koncovém bodu a ve které konfiguraci. Před uvedením do parametru model přidejte libovolný počet modelů, které plánujete použít. Zjistěte, jak do prostředku přidat další modely .

Prozkoumání dalších funkcí

Odvozování modelů Azure AI podporuje další funkce, které nejsou dostupné v modelech GitHubu, včetně následujících:

Máte potíže?

Další nápovědu najdete v části Nejčastější dotazy.

Další kroky