Condividi tramite


Ottimizzazione automatica di Personalizza esperienze (anteprima)

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze verrà ritirato il 1° ottobre 2026.

Introduzione

L'ottimizzazione automatica di Personalizza esperienze consente di risparmiare il lavoro manuale richiesto per garantire a un suo ciclo le migliori prestazioni di apprendimento automatico, tramite la ricerca automatica delle impostazioni di apprendimento migliori usate per eseguire il training dei modelli e la loro applicazione. Personalizza esperienze adotta criteri rigorosi per l'applicazione di nuove impostazioni di apprendimento, al fine di garantire che i miglioramenti non introducano perdite nelle ricompense.

L'ottimizzazione automatica di Personalizza esperienze è disponibile in anteprima pubblica e le funzionalità, gli approcci e i processi cambieranno in base al feedback degli utenti.

Quando usare Ottimizzazione automatica

Nella maggior parte dei casi, l'opzione migliore consiste nell'attivare l’ottimizzazione automatica. Ottimizzazione automatica è attivata per impostazione predefinita per i nuovi cicli di Personalizza esperienze.

L'ottimizzazione automatica può essere utile nelle situazioni seguenti:

  • Si creano applicazioni usate da molti tenant e ognuna ottiene i propri cicli di Personalizza esperienze. Ad esempio, se si ospitano più siti di e-commerce. Ottimizzazione automatica consente di evitare il lavoro manuale richiesto per ottimizzare le impostazioni di apprendimento per un numero elevato di cicli di Personalizza esperienze.
  • Si è distribuito Personalizza esperienze e si è verificato che funzioni correttamente, che ottenga buone ricompense e che non vi siano bug o problemi nelle funzionalità.

Nota

L'ottimizzazione automatica sovrascriverà periodicamente le impostazioni di apprendimento di Personalizza esperienze. Se il caso d'uso o il settore richiede il controllo e l'archiviazione di modelli e impostazioni, oppure se sono necessari backup delle impostazioni precedenti, è possibile usare l'API Personalizza esperienze per recuperare le impostazioni di apprendimento o scaricarle tramite il portale di Azure.

Come abilitare e disabilitare l'ottimizzazione automatica

Per abilitare l'ottimizzazione automatica, usare l'interruttore di attivazione/disattivazione nel pannello "Impostazioni modello e apprendimento" nel portale di Azure.

In alternativo, è possibile attivare l'ottimizzazione automatica usando l'API /configurations/service di Personalizza esperienze.

Per disabilitare Ottimizzazione automatica, disattivare l'interruttore.

Ottimizzare automaticamente i report

Nel pannello Impostazioni modello e apprendimento è possibile visualizzare la cronologia delle esecuzioni di ottimizzazione automatica e l'azione eseguita per ognuna di esse.

La tabella mostra:

  • Quando si è verificata un'esecuzione di ottimizzazione automatica.
  • Quale finestra di dati è stata inclusa.
  • Quali sono state le prestazioni di ricompensa delle impostazioni di apprendimento online, di base e più trovate.
  • Azioni eseguite: se le impostazioni di apprendimento sono state aggiornate o meno.

Le prestazioni di ricompensa delle diverse impostazioni di apprendimento in ogni riga della cronologia di ottimizzazione automatica vengono visualizzate in numeri assoluti e in percentuale rispetto alle prestazioni di base.

Esempio: se la ricompensa media di base è stimata a 0,20 e il comportamento di Personalizza esperienze online raggiunge 0,30, questi valori saranno indicati rispettivamente come 100% e 150%. Se l'ottimizzazione automatica ha rilevato impostazioni di apprendimento in grado di ottenere una ricompensa media di 0,40, verrà visualizzata come 200% (0,40 è il 200% di 0,20). Supponendo che i margini di confidenza lo consentano, si applicheranno le nuove impostazioni, che saranno poi usate da Personalizza esperienze come impostazioni online fino all'esecuzione successiva.

Per l'analisi viene conservata una cronologia di un massimo di 24 esecuzioni precedenti di ottimizzazione automatica. È possibile cercare altri dettagli su tali valutazioni e report offline per ognuno di essi. I report inoltre contengono tutte le impostazioni di apprendimento presenti in questa cronologia, che è possibile trovare e scaricare o applicare.

Funzionamento

Personalizza esperienze esegue costantemente il training dei modelli di intelligenza artificiale usati in base alle ricompense. Il training viene eseguito seguendo alcune impostazioni di apprendimento, che contengono iperparametri e altri valori usati nel processo di addestramento. Queste impostazioni di apprendimento possono essere "ottimizzate" in base all'istanza specifica di Personalizza esperienze.

Personalizza esperienze è anche in grado di eseguire Valutazioni offline. Le valutazioni offline esaminano i dati pregressi e possono produrre una stima statistica della ricompensa media che diversi algoritmi e modelli di Personalizza esperienze avrebbero potuto ottenere. Durante questo processo, Personalizza esperienze cercherà anche impostazioni di apprendimento migliori, stimandone le prestazioni, ad esempio il numero di ricompense che avrebbero potuto ottenere in quel periodo di tempo.

Frequenza dell’ottimizzazione automatica

L'ottimizzazione automatica verrà eseguita periodicamente e si baserà sui dati pregressi.

  • Ad esempio, se l'applicazione invia a Personalizza esperienze più di circa 20 Mb di dati nelle ultime due settimane, userà le ultime due settimane di dati.
  • Se invece l'applicazione invia meno di questa quantità, Personalizza esperienze aggiungerà i dati dei giorni precedenti fino a quando non saranno disponibili dati sufficienti per l'ottimizzazione, oppure non raggiungerà i dati archiviati meno recenti (fino al numero di giorni di conservazione dei dati).

Gli orari e i giorni esatti in cui viene eseguita l'ottimizzazione automatica vengono determinati dal servizio Personalizza esperienze e variano nel tempo.

Criteri per l'aggiornamento delle impostazioni di apprendimento

Personalizza esperienze usa queste stime della ricompensa per decidere se modificare le impostazioni di apprendimento correnti per gli altri utenti. Ogni stima è una curva di distribuzione, con limiti di confidenza superiori e inferiori del 95%. Personalizza esperienze applicherà le nuove impostazioni di apprendimento solo se:

  • Hanno mostrato ricompense medie più elevate nel periodo di valutazione E
  • hanno un limite inferiore dell'intervallo di confidenza del 95%, ovvero superiore al limite inferiore dell'intervallo di confidenza del 95% delle impostazioni di apprendimento online. Questo criterio di massimizzazione del miglioramento della ricompensa, cercando al contempo di eliminare la probabilità di perdita di ricompense future, è gestito da Personalizza esperienze e attinge dalla ricerca sugli algoritmi seldoniani e sulla sicurezza dell'IA.

Limitazioni dell'ottimizzazione automatica

L'ottimizzazione automatica di Personalizza esperienze si basa su una valutazione di un periodo passato per stimare le prestazioni future. È possibile che, a causa di fattori esterni del mondo, dell'applicazione e degli utenti, queste stime e previsioni sui modelli di Personalizza esperienze effettuate per il periodo passato non siano rappresentative del futuro.

L'anteprima dell'ottimizzazione automatica non è disponibile per i cicli di Personalizza esperienze che hanno abilitato la funzionalità di anteprima dell'API di personalizzazione multi-slot.

Passaggi successivi