Delen via


Overzicht: AI-modellen implementeren in de Azure AI Foundry-portal

De modelcatalogus in de Azure AI Foundry-portal is de hub voor het detecteren en gebruiken van een breed scala aan modellen voor het bouwen van generatieve AI-toepassingen. Modellen moeten worden geïmplementeerd om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Het proces van interactie met een geïmplementeerd model wordt deductie genoemd. Azure AI Foundry biedt een uitgebreide reeks implementatieopties voor deze modellen, afhankelijk van uw behoeften en modelvereisten.

Modellen implementeren

Implementatieopties variëren afhankelijk van het modeltype:

  • Azure OpenAI-modellen: de nieuwste OpenAI-modellen met bedrijfsfuncties van Azure.
  • Modellen als een servicemodel: voor deze modellen is geen rekenquotum van uw abonnement vereist. Met deze optie kunt u uw Model as a Service (MaaS) implementeren. U gebruikt een serverloze API-implementatie en wordt per token gefactureerd op basis van betalen per gebruik.
  • Open en aangepaste modellen: De modelcatalogus biedt toegang tot een groot aantal modellen in verschillende modaliteiten die open access zijn. U kunt open modellen in uw eigen abonnement hosten met een beheerde infrastructuur, virtuele machines en het aantal exemplaren voor capaciteitsbeheer. Er is een breed scala aan modellen van Azure OpenAI, Hugging Face en NVIDIA.

Azure AI Foundry biedt vier verschillende implementatieopties:

Naam Azure OpenAI Service Azure AI-modeldeductie Serverloze API Volledig beheerde rekenprocessen
Welke modellen kunnen worden geïmplementeerd? Azure OpenAI-modellen Azure OpenAI-modellen en -modellen als een service Modellen als een service Geopende en aangepaste modellen
Implementatieresource Azure OpenAI-resource Azure AI-servicesresource AI-projectresource AI-projectresource
Het meest geschikt wanneer U bent van plan om alleen OpenAI-modellen te gebruiken U bent van plan om te profiteren van de vlaggenschipmodellen in de Azure AI-catalogus, waaronder OpenAI. U bent van plan om één model van een specifieke provider te gebruiken (met uitzondering van OpenAI). Als u van plan bent open modellen te gebruiken en u voldoende rekenquotum beschikbaar hebt in uw abonnement.
Factureringsbasissen Tokengebruik en PTU Tokengebruik Tokengebruik1 Rekenkernuren2
Implementatie-instructies Implementeren in Azure OpenAI-service Implementeren naar Azure AI-modeldeductie Implementeren naar serverloze API Implementeren in beheerde berekening

1 Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in betalen per gebruik. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

2 Facturering is per minuut, afhankelijk van de productlaag en het aantal exemplaren dat in de implementatie wordt gebruikt sinds het moment van maken. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

Tip

Zie Kosten bewaken voor modellen die worden aangeboden via Azure Marketplace voor meer informatie over het bijhouden van kosten.

Hoe moet ik nadenken over implementatieopties?

Azure AI Foundry moedigt klanten aan om de implementatieopties te verkennen en de optie te kiezen die het beste past bij hun zakelijke en technische behoeften. Over het algemeen kunt u het volgende denkproces gebruiken:

  1. Begin met de implementatieopties met de grotere bereiken. Hierdoor kunt u uw toepassing sneller herhalen en prototypen maken zonder dat u de architectuur telkens opnieuw hoeft te bouwen wanneer u besluit iets te wijzigen. Azure AI-modeldeductie is een implementatiedoel dat ondersteuning biedt voor alle vlaggenschipmodellen in de Azure AI-catalogus, met inbegrip van de nieuwste innovatie van Azure OpenAI. Volg Uw AI-project configureren om azure AI-modeldeductie te gebruiken om aan de slag te gaan.

  2. Wanneer u een specifiek model wilt gebruiken:

    1. Wanneer u geïnteresseerd bent in Azure OpenAI-modellen, gebruikt u de Azure OpenAI-service die een breed scala aan mogelijkheden voor hen biedt en die voor hen is ontworpen.

    2. Als u geïnteresseerd bent in een bepaald model van Models as a Service en u verwacht geen ander type model te gebruiken, gebruikt u serverloze API-eindpunten. Ze staan implementatie van één model toe onder een unieke set eindpunt-URL's en sleutels.

  3. Wanneer uw model niet beschikbaar is in Models as a Service en u een rekenquotum hebt dat beschikbaar is in uw abonnement, gebruikt u Managed Compute die ondersteuning biedt voor de implementatie van open en aangepaste modellen. Het biedt ook een hoog aanpassingsniveau van de implementatiedeductieserver, protocollen en gedetailleerde configuratie.

Tip

Elke implementatieoptie kan verschillende mogelijkheden bieden in termen van netwerken, beveiliging en aanvullende functies, zoals inhoudsveiligheid. Raadpleeg de documentatie voor elk van hen om inzicht te hebben in hun beperkingen.