Fase di distribuzione del ciclo di vita del processo di data science per i team
Questo articolo descrive gli obiettivi, le attività e i risultati finali associati alla distribuzione del processo di data science per i team. Questo processo fornisce un ciclo di vita consigliato che il team può usare per strutturare i progetti di data science. Il ciclo di vita descrive le fasi principali eseguite dal team, spesso iterativamente:
- Comprensione del business
- Acquisizione e comprensione dei dati
- Modellazione
- Distribuzione
- Accettazione del cliente
Ecco una rappresentazione visiva del ciclo di vita di TDSP:
Obiettivo
L'obiettivo della fase di distribuzione è distribuire modelli con una pipeline di dati in un ambiente di produzione o di produzione per l'accettazione finale del cliente.
Come completare l'attività
L'attività principale per questa fase consiste nell'rendere operativo il modello. distribuire il modello e la pipeline in un ambiente di produzione o di simil-produzione per l'utilizzo da parte dell'applicazione.
Rendere operativo un modello
Dopo aver creato un set di modelli che funzionano correttamente, il team può renderli operativi per consentire ad altre applicazioni di utilizzarli. In base ai requisiti aziendali, le previsioni vengono eseguite in tempo reale o in batch. Per distribuire i modelli, è possibile esporli con un'interfaccia API. Con un'interfaccia, gli utenti possono usare facilmente il modello da varie applicazioni, ad esempio:
- Siti Web
- Fogli di calcolo
- Dashboard
- Applicazioni line-of-business
- Applicazioni back-end
Per alcuni esempi di operazionalizzazione de modello con Azure Machine Learning, vedere Distribuire modelli di apprendimento automatico in Azure. È consigliabile compilare il monitoraggio nel modello di produzione e nella pipeline di dati distribuita. Questa procedura consente allo stato del sistema successivo di segnalare eventuali problemi e risolverli.
Integrazione con MLflow
Per supportare questa fase, è possibile incorporare le funzionalità di Azure Machine Learning seguenti:
Gestione dei modelli: per preparare una distribuzione, inserire un modello in un ambiente di produzione o operativo. MLflow gestisce i modelli pronti per la distribuzione e le versioni, che consentono di migliorare l'operazionalizzazione.
Gestione e distribuzione dei modelli: le funzionalità di gestione del modello di MLflow facilitano il processo di distribuzione, in modo da poter gestire facilmente i modelli in vari ambienti.
Artifacts
In questa fase il team offre:
Dashboard di stato che visualizza le metriche relative all'integrità del sistema e alle metriche chiave. È consigliabile usare Power BI per creare un dashboard.
Report di modellazione finale con i dettagli della distribuzione.
Documento finale dell'architettura della soluzione.
Letteratura con revisione peer
I ricercatori pubblicano studi sul TDSP nella letteratura con revisione peer. Le citazioni offrono l'opportunità di analizzare altre applicazioni o idee simili al TDSP, inclusa la fase del ciclo di vita della distribuzione.
Collaboratori
Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.
Autore principale:
- Mark Tabladillo | Senior Cloud Solution Architect
Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.
Risorse correlate
Questi articoli descrivono le altre fasi del ciclo di vita di TDSP: