Udostępnij za pośrednictwem


Udostępnianie danych przy użyciu otwartego protokołu Delta Sharing (dla dostawców)

Ten artykuł zawiera omówienie sposobu, w jaki dostawcy mogą używać protokołu Delta Sharing do udostępniania danych z obszaru roboczego Azure Databricks z obsługą Unity Catalog dowolnemu użytkownikowi na dowolnej platformie obliczeniowej, wszędzie.

Uwaga

Jeśli jesteś adresatem danych (użytkownik lub grupa użytkowników, którym są udostępniane dane), zamiast tego zobacz Jak uzyskać dostęp do danych udostępnionych Tobie za pomocą Delta Sharing (dla adresatów).

Kto powinien korzystać z protokołu udostępniania otwartego udostępniania różnicowego?

Istnieją trzy sposoby udostępniania danych przy użyciu funkcji udostępniania różnicowego:

  1. Otwarty protokół udostępniania usługi Databricks, omówiony w tym artykule, umożliwia udostępnianie danych, którymi zarządzasz w obszarze roboczym usługi Databricks z włączonym Unity Catalog użytkownikom na dowolnej platformie obliczeniowej.

    To podejście korzysta z serwera Delta Sharing wbudowanego w usługę Azure Databricks i jest przydatne podczas zarządzania danymi przy użyciu Unity Catalog i udostępniania go użytkownikom, którzy nie korzystają z usługi Databricks lub nie mają dostępu do obszaru roboczego usługi Databricks z obsługą Unity Catalog. Integracja z Unity Catalog po stronie dostawcy upraszcza konfigurację i zarządzanie dla dostawców.

  2. Implementacja zarządzana przez klienta serwera udostępniania różnicowego typu open source umożliwia udostępnianie z dowolnej platformy do dowolnej platformy, niezależnie od tego, czy usługa Databricks, czy nie.

    Zobacz github.com/delta-io/delta-sharing.

  3. Protokół udostępniania Databricks-to-Databricks umożliwia udostępnianie danych z obszaru roboczego obsługiwanego przez Unity Catalog użytkownikom, którzy mają również dostęp do obszaru roboczego usługi Databricks obsługiwanego przez Unity Catalog.

    Zobacz Udostępnianie danych przy użyciu protokołu Delta Sharing Databricks-to-Databricks (dla dostawców).

Aby zapoznać się z wprowadzeniem do udostępniania różnicowego i uzyskać więcej informacji na temat tych trzech podejść, zobacz Co to jest udostępnianie różnicowe?.

Przepływ pracy udostępniania otwartego udostępniania usługi Delta

Ta sekcja zawiera ogólne omówienie przepływu pracy otwierania udostępniania z linkami do szczegółowej dokumentacji dla każdego kroku.

W modelu udostępniania różnicowego otwórz udostępnianie:

  1. Dostawca danych tworzy adresata, który jest nazwanym obiektem reprezentującym użytkownika lub grupę użytkowników, którym dostawca danych chce udostępniać dane.

    Gdy dostawca danych tworzy adresata, usługa Azure Databricks generuje token, plik poświadczeń zawierający token i link aktywacji, który dostawca danych może wysłać do adresata w celu uzyskania dostępu do pliku poświadczeń.

    Aby uzyskać szczegółowe informacje, zobacz Krok 1. Tworzenie adresata.

  2. Dostawca danych tworzy udział, który jest nazwanym obiektem zawierającym kolekcję tabel zarejestrowanych w magazynie metadanych Unity Catalog na koncie dostawcy.

    Aby uzyskać szczegółowe informacje, zobacz Tworzenie udziałów i zarządzanie nimi dla Delta Sharing.

  3. Dostawca danych udziela adresatowi dostępu do udziału.

    Aby uzyskać szczegółowe informacje, zobacz Zarządzanie dostępem do danych udostępnianych przez funkcję Delta Sharing dla dostawców.

  4. Dostawca danych wysyła link aktywacji do odbiorcy za pośrednictwem bezpiecznego kanału wraz z instrukcjami dotyczącymi korzystania z linku aktywacji w celu pobrania pliku poświadczeń, który odbiorca będzie używać do nawiązania bezpiecznego połączenia z dostawcą danych w celu odbierania udostępnionych danych.

    Aby uzyskać szczegółowe informacje, zobacz Krok 2: Uzyskiwanie linku aktywacji.

  5. Odbiorca danych jest zgodny z linkiem aktywacji, aby pobrać plik poświadczeń, a następnie używa pliku poświadczeń do uzyskiwania dostępu do udostępnionych danych.

    Udostępnione dane są dostępne tylko do odczytu. Użytkownicy mogą uzyskiwać dostęp do danych przy użyciu wybranej platformy lub narzędzi.

    Aby uzyskać szczegółowe informacje, zobacz Odczyt danych udostępnionych przy użyciu Delta Sharing (open sharing) dla odbiorców.

Zagadnienia dotyczące konfigurowania i zabezpieczeń otwierania udostępniania

Dobre zarządzanie tokenami jest kluczem do bezpiecznego udostępniania danych w przypadku korzystania z modelu otwierania udostępniania:

Dostawcy danych mogą zapewnić dodatkowe zabezpieczenia, przypisując listy dostępu ip w celu ograniczenia dostępu adresata do określonych lokalizacji sieciowych. Zobacz Ograniczanie dostępu adresata do udostępniania różnicowego przy użyciu list dostępu do adresów IP (otwieranie udostępniania).