Passaggio 3. Elaborare una valutazione Set dai feedback degli stakeholder.

Articolo
01/21/2025

flusso di lavoro con set di valutazione evidenziati

Per il codice di esempio in questa sezione, vedere il repository GitHub.

Tempo previsto: 10-60 minuti. Il tempo varia in base alla qualità delle risposte fornite dagli stakeholder. Se le risposte sono disordinate o contengono molte query irrilevanti, sarà necessario dedicare più tempo a filtrare e ripulire i dati.

Panoramica e risultato previsto

Questo passaggio avvierà una valutazione set con il feedback fornito dai portatori di interesse tramite l'applicazione di revisione. Si noti che è possibile iniziare una valutazione set con sole domande, quindi anche se gli stakeholder hanno solo chattato con l'app invece di fornire feedback, è possibile seguire questo passaggio.

Per schema della valutazione dell'agente set, vedere l'input per la valutazione dell'agente schema. I campi in questa schema sono citati nella parte restante di questa sezione.

Al termine di questo passaggio, avrai una Valutazione Set che contiene quanto segue:

Richieste con pollice in su 👍:
- request: come inserito dall'utente.
- expected_response: risposta modificata dall'utente. Se l'utente non ha modificato la risposta, la risposta generata dal modello.
Richieste con pollice in giù 👎:
- request: come inserito dall'utente.
- expected_response: risposta modificata dall'utente. Se l'utente non ha modificato la risposta, la risposta è null.
Richieste senza feedback (nessun pollice in su 👍 o in giù 👎)
- request: come inserito dall'utente.

Per tutte le richieste, se l'utente seleziona pollice in su 👍 per un blocco da retrieved_context, il doc_uri di tale blocco viene incluso in expected_retrieved_context per la domanda.

Importante

Databricks consiglia che la vostra valutazione set contenga almeno 30 domande per get iniziare. Per altre informazioni sul set di set valutazione "buono" set, vedere l ' di valutazione approfondita.

Requisiti

Gli stakeholder hanno usato il modello di verifica (PoC) e fornito feedback.
Tutti i requisiti dei passaggi precedenti.

Istruzioni

Aprire il notebook 04_create_evaluation_set e fare clic su Esegui tutto.
Esaminare la valutazione set per comprendere i dati che sono inclusi. È necessario verificare che la tua valutazione set contenga un insieme di domande set rappresentativo e stimolante. Regolare la valutazione set in base alle esigenze.
Per impostazione predefinita, la valutazione set viene salvata nella Delta table configurata in EVALUATION_SET_FQN nel notebook 00_global_config.

Passaggio successivo

Dopo aver ottenuto una valutazione set, usarla per valutare la qualità, il costo e la latenza dell'app POC. Vedere Passaggio 4. Valutare la qualità del modello di verifica.

< Precedente: Passaggio 2. Distribuire poC e raccogliere commenti e suggerimenti

Successivo: Passaggio 4. Valutare la qualità del modello di verifica >

Condividi tramite

Passaggio 3. Elaborare una valutazione Set dai feedback degli stakeholder.

Panoramica e risultato previsto

Requisiti

Istruzioni

Passaggio successivo

Commenti e suggerimenti

Risorse aggiuntive