Udostępnij za pośrednictwem


Dublowanie wykazu aparatu Unity usługi Azure Databricks (wersja zapoznawcza)

Wiele organizacji rejestruje obecnie swoje dane w wykazie aparatu Unity w usłudze Azure Databricks. Dublowany wykaz aparatu Unity w sieci szkieletowej umożliwia klientowi odczytywanie danych zarządzanych przez wykaz aparatu Unity z obciążeń sieci szkieletowej. Usługi Azure Databricks i Fabric są lepsze razem.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania obszaru roboczego usługi Azure Databricks na potrzeby dublowania wykazu aparatu Unity w sieci szkieletowej, zobacz Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Azure Databricks (wersja zapoznawcza).

Dublowane bazy danych w sieci szkieletowej umożliwiają użytkownikom korzystanie z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych. Możesz cieszyć się łatwym w użyciu produktem zaprojektowanym w celu uproszczenia potrzeb analitycznych i skompilowania na potrzeby otwierania i współpracy między usługami Microsoft Fabric i Azure Databricks.

Gdy używasz sieci szkieletowej do odczytywania danych zarejestrowanych w wykazie aparatu Unity, ważne jest, aby zrozumieć, że nie ma przenoszenia danych ani replikacji danych. Tylko struktura katalogu usługi Azure Databricks jest dublowana w sieci szkieletowej, a podstawowe dane wykazu są dostępne za pomocą skrótów. W związku z tym wszelkie zmiany w danych są natychmiast odzwierciedlane w sieci szkieletowej.

Jakie środowiska analityczne są wbudowane

Katalogi dublowane są elementem w usłudze Fabric Magazyn danych odrębnym od punktu końcowego magazynu i analizy SQL.

Podczas dublowania wykazu aparatu Unity usługi Azure Databricks sieć szkieletowa tworzy trzy elementy:

Dostęp do danych dublowanych w usłudze Azure Databricks można uzyskać na wiele sposobów:

  • Każdy element dublowany w usłudze Azure Databricks ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne utworzone przez proces dublowania. Użyj poleceń języka T-SQL, aby zdefiniować i wysyłać zapytania o obiekty danych z punktu końcowego analizy SQL tylko do odczytu.
  • Użyj usługi Power BI z trybem Direct Lake, aby tworzyć raporty względem elementu usługi Azure Databricks.

Synchronizacja metadanych

Podczas tworzenia nowej dublowanej bazy danych z usługi Azure Databricks w usłudze Fabric domyślnie jest włączona opcja Automatycznie synchronizuj przyszłe zmiany wykazu dla wybranego schematu . Następujące zmiany metadanych są odzwierciedlane w obszarze roboczym usługi Azure Databricks do sieci szkieletowej, jeśli włączono automatyczną synchronizację:

  • Dodawanie schematów do wykazu.
  • Usuwanie schematów z wykazu.
  • Dodawanie tabel do schematu.
  • Usuwanie tabel ze schematu.

Wybór schematu/tabeli:

  • Domyślnie cały wykaz jest wybierany, gdy użytkownik dodaje wykaz.
  • Użytkownik może wykluczyć niektóre tabele w schemacie.
  • Usunięcie zaznaczenia schematu usuwa zaznaczenie wszystkich tabel w schemacie.
  • Jeśli użytkownik wróci i wybierze schemat, wszystkie tabele w schemacie zostaną ponownie wybrane.
  • To samo zachowanie wyboru dotyczy schematów w wykazie.

Istnieją inne warunki filtrowania stosowane do katalogów/schematów/tabel:

  • Zmaterializowane widoki i tabele przesyłania strumieniowego nie będą wyświetlane.
  • Tabele zewnętrzne, które nie obsługują formatu różnicowego, nie będą wyświetlane.