Wykorzystaj Microsoft Fabric do odczytywania danych zarejestrowanych w katalogu Unity.
Ten artykuł zawiera omówienie sposobu używania Microsoft Fabric do odczytywania danych zarejestrowanych w katalogu Unity.
Omówienie integracji Fabric z Unity Catalog
Usługa Azure Databricks używa usługi Azure Data Lake Storage Gen2 do przechowywania otwartych, dostępnych i tanich. Unity Catalog zarządza danymi i kontroluje je na podstawie zasad zdefiniowanych przez użytkownika. Usługa Microsoft Fabric umożliwia użytkownikom odczytywanie niektórych z tych tabel zarejestrowanych w Unity Catalog przy użyciu odwołania do pliku.
Aby umożliwić użytkownikom odczytywanie danych zarejestrowanych w Unity Catalog z Fabric, administrator katalogu Fabric tworzy skróty OneLake, które wskazują na dane zarejestrowane w Unity Catalog. W funkcji udostępniania Fabric, początkowe uzgadnianie odbywa się za pomocą otwartych API Unity Catalog, aby wydawać poświadczenia, które zapewniają dostęp do bazowych ścieżek pamięci masowej dla obsługiwanych tabel. Po potwierdzeniu uzgadniania usługa Fabric tworzy skróty OneLake do danych przechowywanych w usłudze Azure Data Lake Storage Gen2. Poświadczenia udostępniane przez Unity Catalog są krótkotrwałe, odświeżane co godzinę i mogą zostać odwołane przy użyciu Unity Catalog w celu odmowy dostępu użytkownikowi Fabric.
Uwaga
Podczas korzystania z Fabric do odczytywania danych zarejestrowanych w Katalogu Unity ważne jest, aby zrozumieć następujące kwestie:
- Elementy "Lustrzany katalog Azure Databricks" w Fabric nie replikują danych. Poświadczenia dostępu do danych są pobierane na żądanie z silników Fabric przy użyciu Unity Catalog APIs. Usługa Databricks udostępnia otwartą platformę opartą na architekturze lakehouse: kopie danych nie są wymagane ani zalecane.
- Mechanizmy fabryczne przeprowadzają autoryzację za pomocą Unity Catalog korzystając z krótkotrwałych poświadczeń powiązanych z tożsamością użytkownika, który skonfigurował połączenie, a nie użytkownika, który wykonuje zapytania dotyczące rzeczywistych danych. Silniki Fabric nie stosują zasad zarządzania i bezpieczeństwa Unity Catalog do użytkowników Fabric. Innymi słowy, gdy tabela jest udostępniona w Fabric, kontrola dostępu zarządzana przez Unity Catalog nie ma zastosowania do użytkowników Fabric. Może to prowadzić do potencjalnych naruszeń zasad zabezpieczeń informacji firmowych.
Zanim rozpoczniesz
Aby uzyskać dostęp do danych Unity Catalog za pomocą Fabric, użytkownik, który konfiguruje połączenie z Databricks, musi mieć uprawnienia do uzyskiwania tymczasowych danych uwierzytelniających za pomocą otwartego interfejsu API do uwierzytelniania Unity Catalog.
Wymaga to, aby konfigurowany użytkownik miał uprawnienia EXTERNAL USE SCHEMA
w schemacie w Unity Catalog zawierającym tabele, do których będzie uzyskiwany dostęp z Fabric. Zobacz Włączanie dostępu danych zewnętrznych do katalogu aparatu Unity.
Uwaga
Po nawiązaniu połączenia żaden z podrzędnych użytkowników Fabric, którzy mają dostęp do połączenia, nie musi mieć tego uprawnienia, skutecznie omijając zarządzanie katalogiem Unity.
Ograniczenia
Używanie Fabric do odczytywania danych zarejestrowanych w katalogu Unity Catalog nie obsługuje następujących elementów:
- Istniejące zasady zabezpieczeń Katalogu Unity dla użytkowników w dół strumienia w Fabric.
- Widoki, zmaterializowane widoki i tabele przesyłania strumieniowego.
- Katalogi Delta Sharing.
- Katalogi federacyjne lakehouse.
- Tabele z włączonymi filtrami na poziomie wiersza lub maskami kolumn.
- Tabele, które nie używają usługi Delta Lake jako formatu.
- Genealogia katalogu Unity dla operacji wykonywanych w Fabric.
- Obszary robocze usługi Azure Databricks korzystające z prywatnych punktów końcowych lub list dostępu do adresów IP.
- Tabele, których podstawowa usługa Azure Data Lake Storage znajduje się za zaporą.
Korzystanie z sieci szkieletowej wymaga również uruchomionej pojemności sieci szkieletowej do przeprowadzania skanowania i odświeżania metadanych, co wiąże się z dodatkowymi kosztami.
Uwaga
Te ograniczenia nie mają zastosowania w przypadku używania zapytania Direct Query usługi Power BI z danymi zarejestrowanymi w Unity Catalog. Zobacz Alternatywy dostępu do danych zarejestrowanych w wykazie aparatu Unity.
Jak czytać dane z katalogu Unity przy użyciu Fabric
Aby uzyskać pełne instrukcje, zobacz dokumentację firmy Microsoft dotyczącą konfigurowania skrótów sieci szkieletowej.
Alternatywy dostępu do danych zarejestrowanych w katalogu Unity
Usługa Azure Databricks używa usługi Azure Data Lake Storage Gen2 do przechowywania otwartych, dostępnych i tanich. Dowiedz się więcej w Najlepsze praktyki dotyczące magazynu w chmurze z Unity Catalog. Jeśli czujesz się nieswojo w związku z narażeniem na ryzyko i ograniczeniami związanymi z funkcją udostępniania Fabric, zalecamy następujące ścieżki dostępu do danych zarejestrowanych w Unity Catalog: