了解 URI
您可以將資料儲存在本機裝置或雲端的某處。 無論您將資料儲存在何處,您都會想要在訓練機器學習模型時存取資料。 若要在 Azure Machine Learning 中尋找和存取資料,您可以使用 統一資源識別項 (URI)。
了解 URI
URI 會參考資料的位置。 若要讓 Azure Machine Learning 連線到您的資料,您必須使用適當的通訊協定來前置 URI。 在 Azure Machine Learning 內容中使用資料時,有三種常見的通訊協定:
http(s)
:用於公開或私人儲存在 Azure Blob 儲存體內的資料,或公開可用的 HTTP 位置。abfs(s)
:用於 Azure Data Lake Storage Gen 2 中的資料存放區。azureml
:用於儲存在資料存放區中的資料。
例如,您可以在 Azure 中建立 Azure Blob 儲存體。 若要儲存資料,您可以建立名為 training-data
的容器。 在容器內,您會建立資料夾 datastore-path
。 在資料夾內,您會儲存 CSV 檔案 diabetes.csv
。
當您想要從 Azure Machine Learning 工作區存取資料時,可以直接使用資料夾或檔案的路徑。 當您想要直接連線到資料夾或檔案時,您可以使用 http(s)
通訊協定。 如果容器設定為私人,您將必須提供某種驗證才能存取資料,例如共用存取簽章 (SAS)。
當您在 Azure Machine Learning 中建立資料存放區時,您會將連線和驗證資訊儲存在工作區中。 然後,若要存取容器中的資料,您可以使用 azureml
通訊協定。
提示
資料存放區是 Azure 上現有儲存體帳戶的參考。 因此,當您參考儲存在資料存放區中的資料時,可能會參考儲存在 Azure Blob 儲存體或 Azure Data Lake Storage 中的資料。 不過,因為 Azure Machine Learning 會使用與資料存放區一起儲存的連線資訊,所當您參考資料存放區時,不需要進行驗證。
最佳做法是避免在程式碼中包含任何敏感性資料,例如驗證資訊。 因此,請盡可能使用 Azure Machine Learning 中的資料存放區和資料資產。 不過,在筆記本的實驗期間,您可能會想要直接連線到儲存位置,以避免不必要的額外負荷。