Principy identifikátorů URI
Data můžete ukládat na místní zařízení nebo někde v cloudu. Při trénování modelů strojového učení chcete k datům přistupovat všude, kde data ukládáte. K vyhledání a přístupu k datům ve službě Azure Machine Learning můžete použít identifikátory URI (Uniform Resource Identifier).
Principy identifikátorů URI
Identifikátor URI odkazuje na umístění vašich dat. Aby se Služba Azure Machine Learning připojila k vašim datům, musíte předponu identifikátoru URI použít odpovídající protokol. Při práci s daty v kontextu služby Azure Machine Learning existují tři běžné protokoly:
-
http(s)
: Používá se pro veřejná nebo soukromá úložiště dat ve službě Azure Blob Storage nebo veřejně dostupném umístění http.. -
abfs(s)
: Slouží pro úložiště dat v Azure Data Lake Storage Gen2. -
azureml
: Slouží pro data uložená v úložišti dat.
Můžete například vytvořit službu Azure Blob Storage v Azure. K ukládání dat vytvoříte kontejner s názvem training-data
. V kontejneru vytvoříte složku datastore-path
. Ve složce uložíte soubor diabetes.csv
CSV .
Pokud chcete získat přístup k datům z pracovního prostoru Azure Machine Learning, můžete použít cestu ke složce nebo souboru přímo. Pokud se chcete připojit ke složce nebo souboru přímo, můžete použít http(s)
protokol. Pokud je kontejner nastavený na privátní, budete muset poskytnout určitý druh ověřování, abyste získali přístup k datům, jako je sdílený přístupový podpis (SAS).
Při vytváření úložiště dat ve službě Azure Machine Learning uložíte informace o připojení a ověřování v pracovním prostoru. Potom pro přístup k datům v kontejneru můžete použít azureml
protokol.
Tip
Úložiště dat je odkazem na existující účet úložiště v Azure. Proto když odkazujete na data uložená v úložišti dat, můžete odkazovat na data uložená ve službě Azure Blob Storage nebo Azure Data Lake Storage. Když ale odkazujete na úložiště dat, nebudete se muset ověřit, protože azure Machine Learning bude používat informace o připojení uložené v úložišti dat.
Považuje se za osvědčený postup, jak se vyhnout citlivým datům v kódu, jako jsou ověřovací informace. Kdykoli je to možné, měli byste proto pracovat s úložišti dat a datovými prostředky ve službě Azure Machine Learning. Během experimentování v poznámkových blocích se ale můžete chtít připojit přímo k umístění úložiště, abyste se vyhnuli zbytečným režijním nákladům.