Konfigurowanie dostępu do danych na potrzeby pozyskiwania
W tym artykule opisano, jak użytkownicy administracyjni mogą konfigurować dostęp do danych w kontenerze w usłudze Azure Data Lake Storage Gen2 (ADLS Gen2), aby użytkownicy usługi Azure Databricks mogli ładować dane z usługi ADLS Gen2 do tabeli w usłudze Azure Databricks.
W tym artykule opisano następujące sposoby konfigurowania bezpiecznego dostępu do danych źródłowych:
(Zalecane) Utwórz wolumin wykazu aparatu Unity.
Utwórz zewnętrzną lokalizację wykazu aparatu Unity przy użyciu poświadczeń magazynu.
Uruchom zasób obliczeniowy, który używa jednostki usługi.
Generowanie poświadczeń tymczasowych (token sas obiektu blob).
Zanim rozpoczniesz
Przed skonfigurowaniem dostępu do danych w usłudze ADLS Gen2 upewnij się, że masz następujące elementy:
Dane w kontenerze na koncie usługi Azure Storage. Aby utworzyć kontener, zobacz Tworzenie kontenera w dokumentacji usługi Azure Storage.
Aby uzyskać dostęp do danych przy użyciu woluminu wykazu aparatu Unity (zalecane),
READ VOLUME
uprawnienie na woluminie. Aby uzyskać więcej informacji, zobacz Co to są woluminy wykazu aparatu Unity? oraz uprawnienia wykazu aparatu Unity i zabezpieczane obiekty.Aby uzyskać dostęp do danych przy użyciu lokalizacji zewnętrznej wykazu aparatu Unity,
READ FILES
uprawnienie w lokalizacji zewnętrznej. Aby uzyskać więcej informacji, zobacz Tworzenie lokalizacji zewnętrznej w celu połączenia magazynu w chmurze z usługą Azure Databricks.Aby uzyskać dostęp do danych przy użyciu zasobu obliczeniowego z jednostką usługi, uprawnienia administratora obszaru roboczego usługi Azure Databricks.
Aby uzyskać dostęp do danych przy użyciu poświadczeń tymczasowych:
- Uprawnienia administratora obszaru roboczego usługi Azure Databricks.
- Uprawnienia na koncie platformy Azure do tworzenia tokenów SAS obiektów blob. Umożliwia to generowanie poświadczeń tymczasowych.
Usługa Databricks SQL Warehouse. Aby utworzyć usługę SQL Warehouse, zobacz Tworzenie magazynu SQL Warehouse.
Znajomość interfejsu użytkownika sql usługi Databricks.
Konfigurowanie dostępu do magazynu w chmurze
Użyj jednej z następujących metod, aby skonfigurować dostęp do usługi ADLS Gen2:
(Zalecane) Utwórz wolumin wykazu aparatu Unity. Aby uzyskać więcej informacji, zobacz Co to są woluminy wykazu aparatu Unity?.
Skonfiguruj zewnętrzną lokalizację wykazu aparatu Unity przy użyciu poświadczeń magazynu. Aby uzyskać więcej informacji na temat lokalizacji zewnętrznych, zobacz Tworzenie lokalizacji zewnętrznej w celu połączenia magazynu w chmurze z usługą Azure Databricks.
Skonfiguruj zasób obliczeniowy do używania jednostki usługi. Aby uzyskać więcej informacji, zobacz Konfigurowanie jednostki usługi.
Generowanie poświadczeń tymczasowych (tokenu SAS obiektu blob) w celu udostępnienia innym użytkownikom usługi Azure Databricks. Aby uzyskać więcej informacji, zobacz Generowanie poświadczeń tymczasowych na potrzeby pozyskiwania.
Czyszczenie
Jeśli nie chcesz już ich przechowywać, możesz wyczyścić skojarzone zasoby na koncie chmury i usłudze Azure Databricks.
Usuwanie konta magazynu usługi ADLS Gen2
- Otwórz witrynę Azure Portal dla konta platformy Azure, zazwyczaj w witrynie https://portal.azure.com.
- Przejdź do i otwórz konto magazynu.
- Kliknij Usuń.
- Wprowadź nazwę konta magazynu, a następnie kliknij przycisk Usuń.
Zatrzymywanie usługi SQL Warehouse
Jeśli nie używasz usługi SQL Warehouse do wykonywania innych zadań, należy zatrzymać usługę SQL Warehouse, aby uniknąć dodatkowych kosztów.
- Na pasku bocznym aplikacji SQL persona kliknij pozycję SQL Warehouses (Magazyny SQL).
- Obok nazwy usługi SQL Warehouse kliknij pozycję Zatrzymaj.
- Po wyświetleniu monitu kliknij przycisk Zatrzymaj ponownie.
Następne kroki
Po wykonaniu kroków opisanych w tym artykule użytkownicy mogą uruchomić COPY INTO
polecenie w celu załadowania danych z kontenera usługi ADLS Gen2 do obszaru roboczego usługi Azure Databricks.
Aby załadować dane przy użyciu woluminu wykazu aparatu Unity lub lokalizacji zewnętrznej, zobacz Ładowanie danych przy użyciu funkcji COPY INTO z woluminami wykazu aparatu Unity lub lokalizacjami zewnętrznymi.
Aby załadować dane przy użyciu usługi SQL Warehouse z jednostką usługi, zobacz Ładowanie danych przy użyciu funkcji COPY INTO z jednostką usługi.
Aby załadować dane przy użyciu poświadczeń tymczasowych (token SAS obiektu blob), zobacz Ładowanie danych przy użyciu funkcji COPY INTO z poświadczeniami tymczasowymi.