Tworzenie magazynu danych
W usłudze Azure Machine Learning magazyny danych są abstrakcjami dla źródeł danych w chmurze. Hermetyzują one informacje potrzebne do nawiązania połączenia ze źródłami danych i bezpiecznie przechowują te informacje o połączeniu, aby nie trzeba było kodować ich w skryptach.
Zalety korzystania z magazynów danych to:
- Zapewnia łatwe w użyciu identyfikatory URI magazynu danych.
- Ułatwia odnajdywanie danych w usłudze Azure Machine Learning.
- Bezpiecznie przechowuje informacje o połączeniu bez ujawniania wpisów tajnych i kluczy analitykom danych.
Podczas tworzenia magazynu danych za pomocą istniejącego konta magazynu na platformie Azure możesz wybrać między dwiema różnymi metodami uwierzytelniania:
- Oparte na poświadczeniach: użyj jednostki usługi, tokenu sygnatury dostępu współdzielonego (SAS) lub klucza konta, aby uwierzytelnić dostęp do konta magazynu.
- Oparte na tożsamości: użyj tożsamości firmy Microsoft lub tożsamości zarządzanej.
Omówienie typów magazynów danych
Usługa Azure Machine Learning obsługuje tworzenie magazynów danych dla wielu rodzajów źródeł danych platformy Azure, w tym:
- Azure Blob Storage
- Udział plików platformy Azure
- Azure Data Lake (Gen 2)
Korzystanie z wbudowanych magazynów danych
Każdy obszar roboczy ma cztery wbudowane magazyny danych (dwa łączące się z kontenerami obiektów blob usługi Azure Storage i dwa łączące się z udziałami plików usługi Azure Storage), które są używane jako magazyny systemowe przez usługę Azure Machine Learning.
W większości projektów uczenia maszynowego należy pracować z własnymi źródłami danych. Możesz na przykład zintegrować rozwiązanie uczenia maszynowego z danymi z istniejących aplikacji lub potoków inżynierii danych.
Tworzenie magazynu danych
Magazyny danych są dołączone do obszarów roboczych i są używane do przechowywania informacji o połączeniu z usługami magazynu. Podczas tworzenia magazynu danych należy podać nazwę, która może służyć do pobierania informacji o połączeniu.
Magazyny danych umożliwiają łatwe łączenie się z usługami magazynu bez konieczności podawania wszystkich niezbędnych szczegółów za każdym razem, gdy chcesz odczytywać lub zapisywać dane. Tworzy również warstwę ochronną, jeśli chcesz, aby użytkownicy używali danych, ale nie łączą się bezpośrednio z podstawową usługą magazynu.
Tworzenie magazynu danych dla kontenera usługi Azure Blob Storage
Magazyn danych można utworzyć za pomocą graficznego interfejsu użytkownika, interfejsu wiersza polecenia platformy Azure (CLI) lub zestawu Sdk (Software Development Kit) języka Python.
W zależności od usługi magazynu, z którą chcesz nawiązać połączenie, dostępne są różne opcje uwierzytelniania w usłudze Azure Machine Learning.
Jeśli na przykład chcesz utworzyć magazyn danych w celu nawiązania połączenia z kontenerem usługi Azure Blob Storage, możesz użyć klucza konta:
blob_datastore = AzureBlobDatastore(
name = "blob_example",
description = "Datastore pointing to a blob container",
account_name = "mytestblobstore",
container_name = "data-container",
credentials = AccountKeyConfiguration(
account_key="XXXxxxXXXxXXXXxxXXX"
),
)
ml_client.create_or_update(blob_datastore)
Alternatywnie możesz utworzyć magazyn danych w celu nawiązania połączenia z kontenerem usługi Azure Blob Storage przy użyciu tokenu SAS w celu uwierzytelnienia:
blob_datastore = AzureBlobDatastore(
name="blob_sas_example",
description="Datastore pointing to a blob container",
account_name="mytestblobstore",
container_name="data-container",
credentials=SasTokenConfiguration(
sas_token="?xx=XXXX-XX-XX&xx=xxxx&xxx=xxx&xx=xxxxxxxxxxx&xx=XXXX-XX-XXXXX:XX:XXX&xx=XXXX-XX-XXXXX:XX:XXX&xxx=xxxxx&xxx=XXxXXXxxxxxXXXXXXXxXxxxXXXXXxxXXXXXxXXXXxXXXxXXxXX"
),
)
ml_client.create_or_update(blob_datastore)
Napiwek
Dowiedz się więcej na temat tworzenia magazynów danych w celu łączenia się z innymi typami rozwiązań magazynu w chmurze.