Informazioni sugli URI

Completato

È possibile archiviare i dati nel dispositivo locale o in un punto qualsiasi del cloud. Ovunque si archivino i dati, è necessario potervi accedere quando si esegue il training dei modelli di apprendimento automatico. Per trovare e accedere ai dati in Azure Machine Learning, si useranno gli URI (Uniform Resource Identifier).

Informazioni sugli URI

Un URI fa riferimento alla posizione dei dati. Affinché Azure Machine Learning si connetta ai dati, è necessario anteporre all'URI un prefisso con il protocollo appropriato. Esistono tre protocolli comuni per l'uso dei dati nel contesto di Azure Machine Learning:

Diagramma di diversi tipi di protocolli usati da Azure Machine Learning per connettersi a origini dati esterne.

  • http(s): usare per gli archivi dati disponibili pubblicamente o privatamente in Archiviazione BLOB di Azure o pubblicamente in una posizione HTTP(S).
  • abfs(s): usare per gli archivi dati in un Azure Data Lake Storage Gen 2.
  • azureml: usare per i dati archiviati in un archivio dati.

Ad esempio, è possibile creare un'istanza di Archiviazione BLOB di Azure in Azure. Per archiviare i dati, creare un contenitore denominato training-data. All'interno del contenitore si crea una cartella datastore-path. All'interno della cartella, si archivia il file CSV diabetes.csv.

Screenshot dei dati archiviati in Archiviazione BLOB di Azure.

Per accedere ai dati dall'area di lavoro di Azure Machine Learning, è possibile usare direttamente il percorso della cartella o del file. Per connettersi direttamente alla cartella o al file, è possibile usare il protocollo http(s). Se il contenitore è impostato su privato, sarà necessario fornire un tipo di autenticazione per ottenere l'accesso ai dati, ad esempio la firma di accesso condiviso (SAS).

Quando si crea un archivio dati in Azure Machine Learning, le informazioni di connessione e autenticazione verranno archiviate nell'area di lavoro. Per accedere ai dati nel contenitore, è quindi possibile usare il protocollo azureml.

Suggerimento

Un archivio dati è un riferimento a un account di archiviazione esistente in Azure. Pertanto, quando si fa riferimento ai dati archiviati in un archivio dati, è possibile fare riferimento ai dati archiviati in Archiviazione BLOB di Azure o Azure Data Lake Storage. Quando si fa riferimento all'archivio dati, tuttavia, non sarà necessario eseguire l'autenticazione, perché Azure Machine Learning userà le informazioni di connessione archiviate nell'archivio dati.

È considerata una procedura consigliata per evitare eventuali dati sensibili nel codice, ad esempio le informazioni di autenticazione. Pertanto, ogni volta che è possibile, è consigliabile usare archivi dati e asset di dati in Azure Machine Learning. Tuttavia, durante la sperimentazione nei notebook, è possibile connettersi direttamente a una posizione di archiviazione per evitare sovraccarichi non necessari.