Omówienie identyfikatorów URI

Ukończone

Dane można przechowywać na urządzeniu lokalnym lub w chmurze. Wszędzie tam, gdzie przechowujesz dane, chcesz uzyskać dostęp do danych podczas trenowania modeli uczenia maszynowego. Aby znaleźć i uzyskać dostęp do danych w usłudze Azure Machine Learning, możesz użyć identyfikatorów URI (Uniform Resource Identifiers).

Omówienie identyfikatorów URI

Identyfikator URI odwołuje się do lokalizacji danych. Aby usługa Azure Machine Learning łączyła się z danymi, musisz prefiksować identyfikator URI przy użyciu odpowiedniego protokołu. Istnieją trzy typowe protokoły podczas pracy z danymi w kontekście usługi Azure Machine Learning:

Diagram różnych typów protokołów używanych przez usługę Azure Machine Learning do łączenia się z zewnętrznymi źródłami danych.

  • http(s): służy do przechowywania danych publicznie lub prywatnie w usłudze Azure Blob Storage lub publicznie dostępnej lokalizacji http.:
  • abfs(s): służy do przechowywania danych w usłudze Azure Data Lake Storage Gen 2.
  • azureml: służy do przechowywania danych w magazynie danych.

Możesz na przykład utworzyć usługę Azure Blob Storage na platformie Azure. Aby przechowywać dane, należy utworzyć kontener o nazwie training-data. W kontenerze utworzysz folder datastore-path. W folderze zapiszesz plik diabetes.csvCSV .

Zrzut ekranu przedstawiający dane przechowywane w usłudze Azure Blob Storage.

Jeśli chcesz uzyskać dostęp do danych z obszaru roboczego usługi Azure Machine Learning, możesz bezpośrednio użyć ścieżki do folderu lub pliku. Jeśli chcesz nawiązać bezpośrednie połączenie z folderem lub plikiem http(s) , możesz użyć protokołu . Jeśli kontener jest ustawiony na prywatny, musisz podać jakiś rodzaj uwierzytelniania, aby uzyskać dostęp do danych, takich jak sygnatura dostępu współdzielonego (SAS).

Podczas tworzenia magazynu danych w usłudze Azure Machine Learning będziesz przechowywać informacje o połączeniu i uwierzytelnianiu w obszarze roboczym. Następnie, aby uzyskać dostęp do danych w kontenerze, możesz użyć azureml protokołu.

Napiwek

Magazyn danych to odwołanie do istniejącego konta magazynu na platformie Azure. W związku z tym w przypadku odwoływania się do danych przechowywanych w magazynie danych można odwoływać się do danych przechowywanych w usłudze Azure Blob Storage lub Azure Data Lake Storage. Jeśli jednak odwołujesz się do magazynu danych, nie musisz uwierzytelniać się, ponieważ informacje o połączeniu przechowywane w magazynie danych będą używane przez usługę Azure Machine Learning.

Najlepszym rozwiązaniem jest unikanie poufnych danych w kodzie, takich jak informacje o uwierzytelnianiu. W związku z tym, jeśli to możliwe, należy pracować z magazynami danych i elementami zawartości danych w usłudze Azure Machine Learning. Jednak podczas eksperymentowania w notesach możesz połączyć się bezpośrednio z lokalizacją magazynu, aby uniknąć niepotrzebnych obciążeń.