Omówienie identyfikatorów URI
Dane można przechowywać na urządzeniu lokalnym lub w chmurze. Wszędzie tam, gdzie przechowujesz dane, chcesz uzyskać dostęp do danych podczas trenowania modeli uczenia maszynowego. Aby znaleźć i uzyskać dostęp do danych w usłudze Azure Machine Learning, możesz użyć identyfikatorów URI (Uniform Resource Identifiers).
Omówienie identyfikatorów URI
Identyfikator URI odwołuje się do lokalizacji danych. Aby usługa Azure Machine Learning łączyła się z danymi, musisz prefiksować identyfikator URI przy użyciu odpowiedniego protokołu. Istnieją trzy typowe protokoły podczas pracy z danymi w kontekście usługi Azure Machine Learning:
http(s)
: służy do przechowywania danych publicznie lub prywatnie w usłudze Azure Blob Storage lub publicznie dostępnej lokalizacji http.:abfs(s)
: służy do przechowywania danych w usłudze Azure Data Lake Storage Gen 2.azureml
: służy do przechowywania danych w magazynie danych.
Możesz na przykład utworzyć usługę Azure Blob Storage na platformie Azure. Aby przechowywać dane, należy utworzyć kontener o nazwie training-data
. W kontenerze utworzysz folder datastore-path
. W folderze zapiszesz plik diabetes.csv
CSV .
Jeśli chcesz uzyskać dostęp do danych z obszaru roboczego usługi Azure Machine Learning, możesz bezpośrednio użyć ścieżki do folderu lub pliku. Jeśli chcesz nawiązać bezpośrednie połączenie z folderem lub plikiem http(s)
, możesz użyć protokołu . Jeśli kontener jest ustawiony na prywatny, musisz podać jakiś rodzaj uwierzytelniania, aby uzyskać dostęp do danych, takich jak sygnatura dostępu współdzielonego (SAS).
Podczas tworzenia magazynu danych w usłudze Azure Machine Learning będziesz przechowywać informacje o połączeniu i uwierzytelnianiu w obszarze roboczym. Następnie, aby uzyskać dostęp do danych w kontenerze, możesz użyć azureml
protokołu.
Napiwek
Magazyn danych to odwołanie do istniejącego konta magazynu na platformie Azure. W związku z tym w przypadku odwoływania się do danych przechowywanych w magazynie danych można odwoływać się do danych przechowywanych w usłudze Azure Blob Storage lub Azure Data Lake Storage. Jeśli jednak odwołujesz się do magazynu danych, nie musisz uwierzytelniać się, ponieważ informacje o połączeniu przechowywane w magazynie danych będą używane przez usługę Azure Machine Learning.
Najlepszym rozwiązaniem jest unikanie poufnych danych w kodzie, takich jak informacje o uwierzytelnianiu. W związku z tym, jeśli to możliwe, należy pracować z magazynami danych i elementami zawartości danych w usłudze Azure Machine Learning. Jednak podczas eksperymentowania w notesach możesz połączyć się bezpośrednio z lokalizacją magazynu, aby uniknąć niepotrzebnych obciążeń.