Begrijpen hoe het model wordt verbruikt

Voltooid

Stel dat u een data scientist bent en machine learning-modellen traint. Doorgaans voert u zes stappen uit om het model te plannen, te trainen, te implementeren en te bewaken:

Diagram met de zes stappen van het machine learning-proces.

  1. Definieer het probleem: bepaal wat het model moet voorspellen en wanneer het succesvol is.
  2. Haal de gegevens op: Gegevensbronnen zoeken en toegang krijgen.
  3. Bereid de gegevens voor: Verken de gegevens. Schoon en transformeer de gegevens op basis van de vereisten van het model.
  4. Het model trainen: Kies een algoritme en hyperparameterwaarden op basis van de evaluatie en fout.
  5. Integreer het model: Implementeer het model op een eindpunt om voorspellingen te genereren.
  6. Bewaak het model: houd de prestaties van het model bij.

Notitie

Het diagram is een vereenvoudigde weergave van het machine learning-proces. Normaal gesproken is het proces iteratief en doorlopend. Als u bijvoorbeeld het model bewaakt, kunt u besluiten om terug te gaan en het model opnieuw te trainen.

U moet plannen hoe u het model integreert, omdat dit van invloed kan zijn op de wijze waarop u het model traint of welke trainingsgegevens u gebruikt. Als u het model wilt integreren, moet u een model implementeren op een eindpunt. U kunt een model implementeren op een eindpunt voor realtime- of batchvoorspellingen.

Een model implementeren op een eindpunt

Wanneer u een model traint, is het doel om het model vaak te integreren in een toepassing.

Als u eenvoudig een model in een toepassing wilt integreren, kunt u eindpunten gebruiken. Eenvoudig gezegd kan een eindpunt een webadres zijn dat een toepassing kan aanroepen om een bericht terug te krijgen.

Met Azure Machine Learning kunt u uw model implementeren op een eindpunt. Vervolgens kunt u het eindpunt integreren in uw eigen toepassing en het model aanroepen om de voorspellingen op te halen in de toepassing waarin u ze wilt visualiseren.

Wanneer u een model implementeert op een eindpunt, hebt u twee opties:

  • Realtime voorspellingen ophalen
  • Batchvoorspellingen ophalen

Realtime voorspellingen ophalen

Als u wilt dat het model nieuwe gegevens scoren zoals deze binnenkomen, hebt u in realtime voorspellingen nodig.

Realtime voorspellingen zijn vaak nodig wanneer een model wordt gebruikt door een toepassing, zoals een mobiele app of een website.

Stel dat u een website hebt die uw productcatalogus bevat:

  1. Een klant selecteert een product op uw website, zoals een shirt.
  2. Op basis van de selectie van de klant beveelt het model onmiddellijk andere items uit de productcatalogus aan. Op de website worden de aanbevelingen van het model weergegeven.

Diagram van een website van een webwinkel. Bovenaan wordt een shirt weergegeven en de aanbevelingen, op basis van het shirt, worden onderaan weergegeven.

Een klant kan op elk gewenst moment een product in de webwinkel selecteren. U wilt dat het model de aanbevelingen bijna onmiddellijk vindt. De tijd die nodig is om de webpagina te laden en de details van het shirt weer te geven, is de tijd die nodig is om de aanbevelingen of voorspellingen op te halen. Wanneer het shirt wordt weergegeven, kunnen de aanbevelingen ook worden weergegeven.

Batchvoorspellingen ophalen

Als u wilt dat het model nieuwe gegevens in batches beoordeelt en de resultaten opslaat als een bestand of in een database, hebt u batchvoorspellingen nodig.

U kunt bijvoorbeeld een model trainen waarmee de verkoop van sinaasappelsap voor elke toekomstige week wordt voorspeld. Door de verkoop van sinaasappelsap te voorspellen, kunt u ervoor zorgen dat het aanbod voldoende is om te voldoen aan de verwachte vraag.

Stel dat u alle historische verkoopgegevens in een rapport visualiseert. U wilt de voorspelde verkoop in hetzelfde rapport opnemen.

Diagram met een rapport met verschillende grafieken. Een grafiek is een lijndiagram met een blauwe pijl die de voorspelde waarden markeert.

Hoewel sinaasappelsap gedurende de dag wordt verkocht, wilt u de prognose slechts één keer per week berekenen. U kunt de verkoopgegevens gedurende de week verzamelen en het model alleen aanroepen wanneer u de verkoopgegevens van een hele week hebt. Een verzameling gegevenspunten wordt een batch genoemd.