Udostępnij za pośrednictwem


Dublowanie płatka śniegu w usłudze Microsoft Fabric

Odwzorowanie w Fabric zapewnia łatwe środowisko do unikania złożonych operacji ETL (wyodrębnianie, transformacja, ładowanie) i integracji istniejącej hurtowni danych Snowflake z resztą danych w Microsoft Fabric. Istniejące dane usługi Snowflake można stale replikować bezpośrednio do usługi OneLake w usłudze Fabric. Wewnątrz Fabric można odblokować zaawansowane scenariusze analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i udostępniania danych.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania bazy danych Snowflake na potrzeby dublowania w sieci szkieletowej, zobacz Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Snowflake.

Dlaczego warto używać mirroringu w Fabric?

W przypadku funkcji Mirroring w Fabric nie trzeba łączyć różnych usług od wielu dostawców. Zamiast tego możesz korzystać z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych, a także skompilowany pod kątem otwartości i współpracy między firmą Microsoft, snowflake i 1000 rozwiązań technologicznych, które mogą odczytywać format tabeli delta lake typu open source.

Jakie doświadczenia analityczne są wbudowane?

Dublowane bazy danych są elementem w usłudze Fabric Magazyn danych odrębnym od punktu końcowego magazynu i analizy SQL.

Diagram dublowania bazy danych sieci szkieletowej dla rozwiązania Snowflake.

Odbicie lustrzane tworzy trzy elementy w obszarze roboczym usługi Fabric.

  • Element zmirorowanej bazy danych. Odwzorowanie zarządza kopiowaniem danych do OneLake i konwersją na Parquet, w formacie gotowym do analiz. Umożliwia to wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
  • Punkt końcowy analizy SQL
  • Domyślny model semantyczny

Każda dublowana baza danych ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne na podstawie tabel delty utworzonych przez proces dublowania. Użytkownicy mają dostęp do znanych poleceń języka T-SQL, które mogą definiować obiekty danych i wykonywać względem niego zapytania, ale nie manipulować danymi z punktu końcowego analizy SQL, ponieważ jest to kopia tylko do odczytu. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Zapoznaj się z tabelami, które odwołują się do danych w tabelach Delta Lake pochodzących z Snowflake.
  • Tworzenie zapytań i widoków bez użycia kodu oraz wizualna eksploracja danych bez pisania ani jednej linijki kodu.
  • Twórz widoki SQL, wbudowane funkcje TVF (funkcje z wartościami tabel) i procedury składowane w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów.
  • Zadawaj zapytania o dane w innych magazynach i Lakehouse'ach w tym samym obszarze roboczym.

Oprócz edytoraCopilot

Zagadnienia dotyczące zabezpieczeń

Aby włączyć Fabric mirroring, musisz mieć uprawnienia użytkownika do swojej bazy danych Snowflake, która zawiera następujące uprawnienia:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Aby uzyskać więcej informacji, zobacz dokumentację usługi Snowflake dotyczącą uprawnień kontroli dostępu dla tabel przesyłania strumieniowego i Wymaganych uprawnień dla strumieni.

Ważne

Wszelkie szczegółowe zabezpieczenia ustanowione w źródłowym magazynie Snowflake muszą zostać ponownie skonfigurowane w odwzorowanej bazie danych w Microsoft Fabric. Aby uzyskać więcej informacji, zobacz Szczegółowe uprawnienia sql w usłudze Microsoft Fabric.

Rozważania dotyczące kosztów odwzorowania płatka śniegu

Zasoby obliczeniowe platformy Fabric używane do replikowania danych do Fabric OneLake są bezpłatne. Koszt magazynu mirroringu jest bezpłatny do limitu zależnie od pojemności. Aby uzyskać więcej informacji, zobacz Koszty mirroringu oraz Cennik Microsoft Fabric. Obliczenia na potrzeby wykonywania zapytań dotyczących danych przy użyciu języka SQL, usługi Power BI lub platformy Spark są naliczane według regularnych stawek.

Usługa Fabric nie pobiera opłat za przesył danych sieciowych do OneLake na potrzeby mirroringu.

Podczas dublowania danych istnieją koszty obliczeń usługi Snowflake i zapytań w chmurze: zasoby obliczeniowe magazynu wirtualnego i usługi w chmurze.

  • Opłaty za zasoby obliczeniowe magazynu wirtualnego Snowflake:
    • Opłaty za obliczenia będą naliczane po stronie usługi Snowflake, jeśli zmiany danych są odczytywane w Snowflake i następnie odzwierciedlane w usłudze Fabric.
    • Wszystkie zapytania metadanych są uruchamiane w tle, aby sprawdzić, czy wystąpiły zmiany w danych, i nie są naliczane opłaty za obliczenia Snowflake. Jednak zapytania, które generują dane, takie jak SELECT *, wznawiają działanie magazynu Snowflake i będą naliczane opłaty za obliczenia.
  • Opłaty za usługi obliczeniowe Snowflake
    • Chociaż nie ma żadnych opłat za obliczenia dla zadań w tle, takich jak tworzenie, zapytania metadanych, kontrola dostępu, wyświetlanie zmian danych, a nawet zapytania DDL, istnieją koszty chmury związane z tymi zapytaniami.
    • W zależności od tego, jaką posiadasz wersję Snowflake, zostaną naliczone opłaty za odpowiednie kredyty na koszty usług w chmurze.

Na poniższym zrzucie ekranu przedstawiono koszty obliczeniowe magazynu wirtualnego i usług w chmurze dla powiązanej bazy danych Snowflake, która jest synchronizowana do Fabric. W tym scenariuszu większość kosztów obliczeniowych usług w chmurze (w kolorze żółtym) pochodzi z zapytań dotyczących zmian danych w oparciu o wymienione wcześniej punkty. Opłaty za obliczenia magazynu wirtualnego (w kolorze niebieskim) wynikają ściśle z tego, że zmiany danych są odczytywane z usługi Snowflake i dublowane w usłudze Fabric.

Zrzut ekranu przedstawiający wykres kosztów usługi Snowflake.

Aby uzyskać więcej informacji na temat kosztów zapytań dotyczących chmury specyficznych dla usługi Snowflake, zobacz Dokumentację usługi Snowflake: Omówienie ogólnego kosztu.

Następny krok