Udostępnij za pośrednictwem


Otwieranie dublowania w usłudze Microsoft Fabric (wersja zapoznawcza)

Dublowanie w sieci szkieletowej zapewnia łatwe środowisko umożliwiające uniknięcie złożonych operacji ETL (wyodrębnianie transformacji ładowania) i zintegrowanie istniejących danych z usługą OneLake z resztą danych w usłudze Microsoft Fabric. Istniejące dane można stale replikować bezpośrednio do usługi OneLake w usłudze Fabric. Wewnątrz sieci szkieletowej można odblokować zaawansowane scenariusze analizy biznesowej, sztucznej inteligencji, inżynierowie danych, Nauka o danych i udostępniania danych.

Otwieranie dublowania umożliwia każdej aplikacji zapisywanie zmian danych bezpośrednio w dublowanej bazie danych w sieci szkieletowej. Otwieranie dublowania zostało zaprojektowane tak, aby można było rozszerzać, dostosowywać i otwierać. Jest to zaawansowana funkcja, która rozszerza dublowanie w sieci szkieletowej na podstawie otwartego formatu tabeli usługi Delta Lake.

Gdy dane zmieszczą się w usłudze OneLake w sieci szkieletowej, otwarte dublowanie upraszcza obsługę złożonych zmian danych, zapewniając, że wszystkie dublowane dane są stale aktualne i gotowe do analizy.

Ważne

Ta funkcja jest dostępna w wersji zapoznawczej.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania otwartej dublowanej bazy danych w sieci szkieletowej, zobacz Samouczek: konfigurowanie otwartych dublowanych baz danych w usłudze Microsoft Fabric.

Dlaczego warto używać funkcji otwartego dublowania w sieci szkieletowej?

Otwieranie dublowania rozszerza funkcję dublowania w sieci szkieletowej na własne aplikacje lub istniejących dostawców danych, aby umieścić dane w dublowanej bazie danych w usłudze OneLake w sieci szkieletowej. Po wylądowaniu danych w strefie docelowej aparat replikacji dublowania zarządza złożonością zmian i konwertuje dane na delta Parquet w formacie gotowym do analizy. W usłudze OneLake dane mogą być analizowane i używane przez wszystkie środowiska w usłudze Fabric.

Diagram przedstawiający przepływ danych ze strefy docelowej do tabel za pośrednictwem przetwarzania zmienionych danych przechwytywania (CDC).

Otwieranie dublowania spełnia wymagania replikacji danych, jeśli:

  • Użyj własnej aplikacji, aby zapisywać dane w otwartej strefie docelowej dublowania zgodnie z wymaganiami i formatami otwartej strefy docelowej dublowania.
  • Skorzystaj z jednego z naszych istniejących otwartych partnerów dublowania, aby ułatwić pozyskiwanie danych.

Jakie środowiska analityczne są wbudowane?

Wszystkie typy dublowanych baz danych są elementem w usłudze Fabric Magazyn danych odrębnym od punktu końcowego magazynu i analizy SQL.

Dublowanie tworzy trzy elementy w obszarze roboczym usługi Fabric:

  • Element dublowanej bazy danych. Dublowanie zarządza replikacją danych do usługi OneLake i konwersją na format Delta Parquet oraz zarządza złożonością zmian w formacie gotowym do analizy. Umożliwia to wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
  • Punkt końcowy analizy SQL
  • Domyślny model semantyczny

Każda otwarta dublowana baza danych ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne na podstawie tabel delty utworzonych przez proces dublowania. Użytkownicy mają dostęp do znanych poleceń języka T-SQL, które mogą definiować obiekty danych i wykonywać względem niego zapytania, ale nie manipulować danymi z punktu końcowego analizy SQL, ponieważ jest to kopia tylko do odczytu. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Zapoznaj się z tabelami, które odwołują się do danych w tabelach usługi Delta Lake.
  • Tworzenie żadnych zapytań i widoków kodu oraz eksplorowanie danych wizualnie bez konieczności pisania wiersza kodu.
  • Twórz widoki SQL, wbudowane funkcje TVF (funkcje z wartościami tabel) i procedury składowane w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów.
  • Wykonywanie zapytań o dane w innych magazynach i magazynach Lakehouse w tym samym obszarze roboczym.

Oprócz edytora zapytań SQL istnieje szeroki ekosystem narzędzi, które mogą wykonywać zapytania dotyczące punktu końcowego analizy SQL, w tym programu SQL Server Management Studio (SSMS), rozszerzenia mssql z programem Visual Studio Code, a nawet usługi GitHubCopilot.

Zagadnienia dotyczące kosztów dublowania otwartego

Podobnie jak w przypadku wszystkich typów dublowania w sieci szkieletowej, otwarte dublowanie oferuje bezpłatny terabajt magazynu dublowania dla każdej jednostki pojemności (CU) zakupionej i aprowizowanej. Na przykład w przypadku zakupu F64 otrzymasz 64 bezpłatne terabajty magazynu dla replik dublowanych. Opłata za magazyn OneLake jest naliczana tylko po przekroczeniu limitu magazynu dublowania wolnego lub wstrzymaniu pojemności.

Ponadto zasoby obliczeniowe potrzebne do zarządzania złożonością danych zmian są bezpłatne i nie zużywają pojemności. Żądania do usługi OneLake w ramach procesu dublowania zużywają pojemność, taką jak zwykle w przypadku użycia zasobów obliczeniowych w usłudze OneLake.

Następny krok