Hoe Personalizer werkt

Artikel
10/16/2024

Belangrijk

Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.

De Personalizer-resource, uw leerlus, maakt gebruik van machine learning om het model te bouwen dat de belangrijkste actie voor uw inhoud voorspelt. Het model wordt uitsluitend getraind op uw gegevens die u naar het model hebt verzonden met de Rank- en Reward-aanroepen. Elke lus is volledig onafhankelijk van elkaar.

Rank- en Reward-API's zijn van invloed op het model

U verzendt acties met functies en contextfuncties naar de Rank-API. De Rank-API besluit om een van de volgende opties te gebruiken:

Exploit: Het huidige model om de beste actie te bepalen op basis van eerdere gegevens.
Verkennen: Selecteer een andere actie in plaats van de bovenste actie. U configureert dit percentage voor uw Personalizer-resource in Azure Portal.

U bepaalt de beloningsscore en verzendt deze score naar de Reward-API. De Reward-API :

Verzamelt gegevens om het model te trainen door de functies en beloningsscores van elke rangschikking op te nemen.
Gebruikt die gegevens om het model bij te werken op basis van de configuratie die is opgegeven in het leerbeleid.

Uw systeem die Personalizer aanroept

In de volgende afbeelding ziet u de architectuurstroom voor het aanroepen van de Rank- en Reward-aanroepen:

alternatieve tekst

U verzendt acties met functies en contextfuncties naar de Rank-API.
- Personalizer bepaalt of het huidige model moet worden gebruikt of nieuwe keuzes voor het model moet worden verkend.
- Het classificatieresultaat wordt verzonden naar EventHub.
De hoogste rang wordt als beloningsactie-id geretourneerd naar uw systeem. Uw systeem presenteert die inhoud en bepaalt een beloningsscore op basis van uw eigen bedrijfsregels.
Uw systeem retourneert de beloningsscore naar de leerlus.
- Wanneer Personalizer de beloning ontvangt, wordt de beloning verzonden naar EventHub.
- De rang en beloning zijn gecorreleerd.
- Het AI-model wordt bijgewerkt op basis van de correlatieresultaten.
- De deductie-engine wordt bijgewerkt met het nieuwe model.

Uw model opnieuw trainen met Personalizer

Met Personalizer wordt uw model opnieuw getraind op basis van de instelling voor het bijwerken van de modelfrequentie op uw Personalizer-resource in Azure Portal.

Personalizer gebruikt alle gegevens die momenteel worden bewaard, op basis van de instelling voor gegevensretentie in het aantal dagen op uw Personalizer-resource in Azure Portal.

Onderzoek achter Personalizer

Personalizer is gebaseerd op geavanceerde wetenschap en onderzoek op het gebied van Reinforcement Learning , waaronder documenten, onderzoeksactiviteiten en doorlopende verkenningsgebieden in Microsoft Research.

Volgende stappen

Meer informatie over de belangrijkste scenario's voor Personalizer

Delen via