Identificare le risorse di Azure Machine Learning

Completato

Le risorse in Azure Machine Learning fanno riferimento all'infrastruttura necessaria per eseguire un flusso di lavoro di Machine Learning. Idealmente, si vuole che un utente come un amministratore crei e gestisca le risorse.

Le risorse in Azure Machine Learning includono:

  • L'area di lavoro
  • Risorse di calcolo
  • Archivi dati

Creare e gestire l'area di lavoro

L'area di lavoro è la risorsa di primo livello per Azure Machine Learning. I data scientist devono accedere all'area di lavoro per eseguire il training e il rilevamento dei modelli e per distribuire i modelli agli endpoint.

Tuttavia, è consigliabile prestare attenzione a chi ha un accesso completo all'area di lavoro. Accanto ai riferimenti alle risorse di calcolo e agli archivi dati, è possibile trovare tutti i log, le metriche, gli output, i modelli e gli snapshot del codice nell'area di lavoro.

Creare e gestire risorse di calcolo

Una delle risorse più importanti necessarie per il training o la distribuzione di un modello è il calcolo. Nell'area di lavoro di Azure Machine Learning sono disponibili cinque tipi di calcolo:

  • Istanze di ambiente di calcolo: Simile a una macchina virtuale nel cloud, gestita dall'area di lavoro. Ideale da usare come ambiente di sviluppo per l'esecuzione di notebook (Jupyter).
  • Cluster di elaborazione: Cluster su richiesta di nodi di calcolo CPU o GPU nel cloud, gestiti dall'area di lavoro. Ideale da usare per i carichi di lavoro di produzione man mano che vengono ridimensionati automaticamente in base alle esigenze.
  • Cluster Kubernetes: Consente di creare o collegare un cluster del servizio Azure Kubernetes. Ideale per distribuire modelli di Machine Learning sottoposti a training in scenari di produzione.
  • Ambienti di calcolo collegati: Consente di collegare altre risorse di calcolo di Azure all'area di lavoro, ad esempio pool di Azure Databricks o Synapse Spark.
  • Elaborazione serverless: Un ambiente di calcolo completamente gestito su richiesta che è possibile usare per i processi di training.

Nota

Man mano che Azure Machine Learning crea e gestisce automaticamente il calcolo serverless; non è elencato nella pagina di calcolo in studio. Altre informazioni su come usare il calcolo serverless per il training del modello

Anche se il calcolo è la risorsa più importante quando si lavora con carichi di lavoro di Machine Learning, può anche essere il più costoso. Pertanto, è consigliabile consentire solo agli amministratori di creare e gestire le risorse di calcolo. I data scientist non devono essere autorizzati a modificare il calcolo, ma usare solo il calcolo disponibile per eseguire i carichi di lavoro.

Creare e gestire archivi dati

L'area di lavoro non archivia dati. Tutti i dati vengono invece archiviati in archivi dati, che sono riferimenti ai servizi dati di Azure. Le informazioni di connessione a un servizio dati rappresentato da un archivio dati vengono archiviate in Azure Key Vault.

Quando viene creata un'area di lavoro, viene creato e connesso automaticamente all'area di lavoro un account di archiviazione di Azure. Di conseguenza, si avranno quattro archivi dati già aggiunti all'area di lavoro:

  • workspaceartifactstore: Si connette al contenitore azureml dell'account di archiviazione di Azure creato con l'area di lavoro. Usato per archiviare i log di calcolo e di esperimento durante l'esecuzione di processi.
  • workspaceworkingdirectory: Si connette alla condivisione file dell'account di archiviazione di Azure creato con l'area di lavoro usata dalla sezione notebook dello studio. Ogni volta che si caricano file o cartelle per accedere da un'istanza di calcolo, i file o le cartelle vengono caricati in questa condivisione file.
  • workspaceblobstore: si connette alla condivisione file dell'account di archiviazione di Azure creato con l'area di lavoro. In particolare il contenitore azureml-blobstore-.... Impostare come archivio dati predefinito, ovvero ogni volta che si crea un asset di dati e si caricano i dati, i dati vengono archiviati in questo contenitore.
  • workspacefilestore: si connette alla condivisione file dell'account di archiviazione di Azure creato con l'area di lavoro. In particolare, la condivisione file azureml-filestore-....

È anche possibile creare archivi dati per connettersi ad altri servizi dati di Azure. In genere, gli archivi dati si connettono a un account di archiviazione di Azure o Azure Data Lake Storage (Gen2) poiché tali servizi dati sono usati più spesso nei progetti di data science.