Uppgradera från GitHub-modeller till Azure AI-modellinferens
Om du vill utveckla ett generativt AI-program kan du använda GitHub-modeller för att hitta och experimentera med AI-modeller utan kostnad. Lekplatsen och den kostnadsfria API-användningen begränsas av begäranden per minut, begäranden per dag, token per begäran och samtidiga begäranden. Om du får en begränsad hastighet måste du vänta tills den hastighetsgräns som du når för att återställa innan du kan göra fler begäranden.
När du är redo att ta ditt program till produktion kan du uppgradera din upplevelse genom att distribuera en Azure AI Services-resurs i en Azure-prenumeration och börja använda Azure AI-modellinferenstjänsten. Du behöver inte ändra något annat i koden.
I följande artikel beskrivs hur du kommer igång från GitHub-modeller och distribuerar en Azure AI Services-resurs med Azure AI-modellinferens.
Förutsättningar
För att slutföra självstudierna behöver du:
- Ett GitHub-konto med åtkomst till GitHub-modeller.
- En Azure-prenumeration Om du inte har ett konto uppmanas du att skapa eller uppdatera ditt Azure-konto till ett betala per användning-konto när du är redo att distribuera din modell till produktion.
Uppgradera till Azure AI-modellinferens
Hastighetsgränserna för lekplatsen och den kostnadsfria API-användningen är avsedda att hjälpa dig att experimentera med modeller och utveckla ditt AI-program. När du är redo att ta programmet till produktion använder du en nyckel och slutpunkt från ett betalt Azure-konto. Du behöver inte ändra något annat i koden.
Så här hämtar du nyckeln och slutpunkten:
Kom till GitHub-modeller och välj den modell som du är intresserad av.
På lekplatsen för din modell väljer du Hämta API-nyckel.
Välj Hämta produktionsnyckel.
Om du inte har något Azure-konto väljer du Skapa mitt konto och följer stegen för att skapa ett.
Om du har ett Azure-konto väljer du Logga in igen.
Om ditt befintliga konto är ett kostnadsfritt konto måste du först uppgradera till en betala per användning-plan. När du har uppgraderat går du tillbaka till lekplatsen och väljer Hämta API-nyckel igen och loggar sedan in med ditt uppgraderade konto.
När du har loggat in på ditt Azure-konto tas du till Azure AI Studio > GitHub. Det kan ta en eller två minuter att läsa in din ursprungliga modellinformation i AI Studio.
Sidan läses in med din modells information. Välj knappen Distribuera för att distribuera modellen till ditt konto.
När den har distribuerats visas din modells API-nyckel och slutpunkt i översikten. Använd dessa värden i koden för att använda modellen i produktionsmiljön.
I det här läget är den modell som du har valt redo att använda.
Uppgradera koden för att använda den nya slutpunkten
När din Azure AI Services-resurs har konfigurerats kan du börja använda den från din kod. Om du vill använda Azure AI Services-resursen behöver du slutpunkts-URL:en och nyckeln, som är tillgängliga i avsnittet Översikt :
Du kan använda någon av de SDK:er som stöds för att få ut förutsägelser från slutpunkten. Följande SDK:er stöds officiellt:
- OpenAI SDK
- Azure OpenAI SDK
- Azure AI-slutsatsdragnings-SDK
Mer information och exempel finns i avsnittet språk som stöds och SDK:er . I följande exempel visas hur du använder Azure AI-modellens slutsatsdragnings-SDK med den nyligen distribuerade modellen:
Installera paketet azure-ai-inference
med hjälp av pakethanteraren, till exempel pip:
pip install azure-ai-inference
Sedan kan du använda paketet för att använda modellen. I följande exempel visas hur du skapar en klient för att använda chattavslutningar:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential
model = ChatCompletionsClient(
endpoint="https://<resource>.services.ai.azure.com/models",
credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)
Utforska våra exempel och läs API-referensdokumentationen för att komma igång.
Generera din första chatt:
from azure.ai.inference.models import SystemMessage, UserMessage
response = client.complete(
messages=[
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
],
model="mistral-large"
)
print(response.choices[0].message.content)
Använd parametern model="<deployment-name>
för att dirigera din begäran till den här distributionen.
Distributioner fungerar som ett alias för en viss modell under vissa konfigurationer. Se sidan Routningskoncept för att lära dig hur Azure AI Services dirigerar distributioner.
Viktigt!
Till skillnad från GitHub-modeller där alla modeller redan är konfigurerade kan du med Azure AI Services-resursen styra vilka modeller som är tillgängliga i slutpunkten och under vilken konfiguration. Lägg till så många modeller som du planerar att använda innan du anger dem i parametern model
. Lär dig hur du lägger till fler modeller i resursen.
Utforska ytterligare funktioner
Azure AI-modellinferens stöder ytterligare funktioner som inte är tillgängliga i GitHub-modeller, inklusive:
- Utforska modellkatalogen för att se ytterligare modeller som inte är tillgängliga i GitHub-modeller.
- Konfigurera nyckellös autentisering.
- Konfigurera innehållsfiltrering.
- Konfigurera hastighetsbegränsning (för specifika modeller).
- Utforska ytterligare distributions-SKU:er (för specifika modeller).
- Konfigurera privata nätverk.
Har du problem?
Mer hjälp finns i avsnittet Vanliga frågor och svar.
Nästa steg
- Utforska modellkatalogen i Azure AI Studio.
- Lägg till fler modeller i slutpunkten.