Delen via


Eindpunten maken voor geïmplementeerde Machine Learning Studio-webservices (klassiek)

VAN TOEPASSING OP: Van toepassing op. Machine Learning Studio (klassiek) Is niet van toepassing op.Azure Machine Learning

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Na de implementatie van een webservice wordt een standaardeindpunt voor de service gemaakt. Het standaardeindpunt kan worden aangeroepen met de API-sleutel. U kunt meer eindpunten toevoegen met hun eigen sleutels vanuit de webservicesportal. Elk eindpunt in de webservice wordt onafhankelijk aangepakt, beperkt en beheerd. Elk eindpunt is een unieke URL met een autorisatiesleutel die u kunt distribueren naar uw klanten.

Eindpunten toevoegen aan een webservice

U kunt een eindpunt toevoegen aan een webservice met behulp van de Machine Learning Web Services-portal. Zodra het eindpunt is gemaakt, kunt u het gebruiken via synchrone API's, batch-API's en Excel-werkbladen.

Notitie

Als u extra eindpunten aan de webservice hebt toegevoegd, kunt u het standaardeindpunt niet verwijderen.

  1. Klik in Machine Learning Studio (klassiek) in de linkernavigatiekolom op Web Services.
  2. Klik onder aan het dashboard van de webservice op Eindpunten beheren. De Machine Learning Web Services-portal wordt geopend op de pagina eindpunten voor de webservice.
  3. Klik op Nieuw.
  4. Typ een naam en beschrijving voor het nieuwe eindpunt. Eindpuntnamen moeten 24 tekens of minder lang zijn en moeten bestaan uit kleine letters of cijfers. Selecteer het niveau van de logboekregistratie en of voorbeeldgegevens zijn ingeschakeld. Zie Logboekregistratie inschakelen voor Machine Learning-webservices voor meer informatie over logboekregistratie.

Een webservice schalen door extra eindpunten toe te voegen

Standaard is elke gepubliceerde webservice geconfigureerd ter ondersteuning van 20 gelijktijdige aanvragen en kan maximaal 200 gelijktijdige aanvragen zijn. Machine Learning Studio (klassiek) optimaliseert automatisch de instelling om de beste prestaties voor uw webservice te bieden en de portalwaarde wordt genegeerd.

Als u van plan bent om de API aan te roepen met een hogere belasting dan de waarde voor maximaal gelijktijdige aanroepen van 200, moet u meerdere eindpunten maken in dezelfde webservice. Vervolgens kunt u uw belasting willekeurig over al deze verdelen.

Het schalen van een webservice is een algemene taak. Een aantal redenen om te schalen zijn om ondersteuning te bieden voor meer dan 200 gelijktijdige aanvragen, het verhogen van de beschikbaarheid via meerdere eindpunten of het bieden van afzonderlijke eindpunten voor de webservice. U kunt de schaal vergroten door extra eindpunten voor dezelfde webservice toe te voegen via de Machine Learning-webserviceportal .

Houd er rekening mee dat het gebruik van een hoog aantal gelijktijdigheid nadelig kan zijn als u de API niet aanroept met een overeenkomstig hoog tarief. Mogelijk ziet u sporadische time-outs en/of pieken in de latentie als u een relatief lage belasting op een API plaatst die is geconfigureerd voor hoge belasting.

De synchrone API's worden doorgaans gebruikt in situaties waarin een lage latentie gewenst is. Latentie hier impliceert de tijd die de API nodig heeft om één aanvraag te voltooien en houdt geen rekening met netwerkvertragingen. Stel dat u een API hebt met een latentie van 50 ms. Als u de beschikbare capaciteit volledig wilt verbruiken met beperkingsniveau Hoog en Max Gelijktijdige aanroepen = 20, moet u deze API 20 * 1000 / 50 = 400 keer per seconde aanroepen. Als u dit verder uitbreidt, kunt u maximaal 200 gelijktijdige aanroepen van de API 4000 keer per seconde, uitgaande van een latentie van 50 ms.

Volgende stappen

Een Machine Learning-webservice gebruiken.