Dublowanie wykazu aparatu Unity usługi Azure Databricks (wersja zapoznawcza)

Artykuł
11/24/2024

Wiele organizacji rejestruje obecnie swoje dane w wykazie aparatu Unity w usłudze Azure Databricks. Dublowany wykaz aparatu Unity w sieci szkieletowej umożliwia klientowi odczytywanie danych zarządzanych przez wykaz aparatu Unity z obciążeń sieci szkieletowej. Usługi Azure Databricks i Fabric są lepsze razem.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania obszaru roboczego usługi Azure Databricks na potrzeby dublowania wykazu aparatu Unity w sieci szkieletowej, zobacz Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Azure Databricks (wersja zapoznawcza).

Dublowane bazy danych w sieci szkieletowej umożliwiają użytkownikom korzystanie z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych. Możesz cieszyć się łatwym w użyciu produktem zaprojektowanym w celu uproszczenia potrzeb analitycznych i skompilowania na potrzeby otwierania i współpracy między usługami Microsoft Fabric i Azure Databricks.

Gdy używasz sieci szkieletowej do odczytywania danych zarejestrowanych w wykazie aparatu Unity, nie ma przenoszenia danych ani replikacji danych. Tylko struktura katalogu usługi Azure Databricks jest dublowana w sieci szkieletowej, a podstawowe dane wykazu są dostępne za pomocą skrótów. W związku z tym wszelkie zmiany w danych są natychmiast odzwierciedlane w sieci szkieletowej.

Jakie środowiska analityczne są wbudowane

Katalogi dublowane są elementem w usłudze Fabric Magazyn danych odrębnym od punktu końcowego magazynu i analizy SQL.

Podczas dublowania wykazu aparatu Unity usługi Azure Databricks sieć szkieletowa tworzy trzy elementy:

Element dublowany usługi Azure Databricks
Punkt końcowy analizy SQL w usłudze Lakehouse
Domyślny model semantyczny

Dostęp do danych dublowanych w usłudze Azure Databricks można uzyskać na wiele sposobów:

Każdy element dublowany w usłudze Azure Databricks ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne utworzone przez proces dublowania. Użyj poleceń języka T-SQL, aby zdefiniować i wysyłać zapytania o obiekty danych z punktu końcowego analizy SQL tylko do odczytu.
Użyj usługi Power BI z trybem Direct Lake, aby tworzyć raporty względem elementu usługi Azure Databricks.

Synchronizacja metadanych

Podczas tworzenia nowej dublowanej bazy danych z usługi Azure Databricks w usłudze Fabric domyślnie jest włączona opcja Automatycznie synchronizuj przyszłe zmiany wykazu dla wybranego schematu . Następujące zmiany metadanych są odzwierciedlane w obszarze roboczym usługi Azure Databricks do sieci szkieletowej, jeśli włączono automatyczną synchronizację:

Dodawanie schematów do wykazu.
Usuwanie schematów z wykazu.
Dodawanie tabel do schematu.
Usuwanie tabel ze schematu.

Wybór schematu/tabeli:

Domyślnie cały wykaz jest wybierany, gdy użytkownik dodaje wykaz.
Użytkownik może wykluczyć niektóre tabele w schemacie.
Usunięcie zaznaczenia schematu usuwa zaznaczenie wszystkich tabel w schemacie.
Jeśli użytkownik wróci i wybierze schemat, wszystkie tabele w schemacie zostaną ponownie wybrane.
To samo zachowanie wyboru dotyczy schematów w wykazie.

Istnieją inne warunki filtrowania stosowane do katalogów/schematów/tabel:

Zmaterializowane widoki i tabele przesyłania strumieniowego nie będą wyświetlane.
Tabele zewnętrzne, które nie obsługują formatu różnicowego, nie będą wyświetlane.

Udostępnij za pośrednictwem

Dublowanie wykazu aparatu Unity usługi Azure Databricks (wersja zapoznawcza)

Jakie środowiska analityczne są wbudowane

Synchronizacja metadanych

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Dublowanie wykazu aparatu Unity usługi Azure Databricks (wersja zapoznawcza)

Jakie środowiska analityczne są wbudowane

Synchronizacja metadanych

Powiązana zawartość

Opinia

Dodatkowe zasoby