Udostępnij za pośrednictwem


Dublowanie płatka śniegu w usłudze Microsoft Fabric

Dublowanie w sieci szkieletowej zapewnia łatwe środowisko umożliwiające uniknięcie złożonych operacji ETL (wyodrębnianie transformacji ładowania) i zintegrowanie istniejących danych magazynu Snowflake z resztą danych w usłudze Microsoft Fabric. Istniejące dane usługi Snowflake można stale replikować bezpośrednio do usługi OneLake w usłudze Fabric. Wewnątrz sieci szkieletowej można odblokować zaawansowane scenariusze analizy biznesowej, sztucznej inteligencji, inżynierowie danych, Nauka o danych i udostępniania danych.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania bazy danych Snowflake na potrzeby dublowania w sieci szkieletowej, zobacz Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Snowflake.

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

W przypadku dublowania w sieci szkieletowej nie trzeba łączyć różnych usług od wielu dostawców. Zamiast tego możesz korzystać z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych, a także skompilowany pod kątem otwartości i współpracy między firmą Microsoft, snowflake i 1000 rozwiązań technologicznych, które mogą odczytywać format tabeli delta lake typu open source.

Jakie środowiska analityczne są wbudowane?

Dublowane bazy danych są elementem w usłudze Fabric Magazyn danych odrębnym od punktu końcowego magazynu i analizy SQL.

Diagram dublowania bazy danych sieci szkieletowej dla rozwiązania Snowflake.

Dublowanie tworzy trzy elementy w obszarze roboczym usługi Fabric:

Każda dublowana baza danych ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne na podstawie tabel delty utworzonych przez proces dublowania. Użytkownicy mają dostęp do znanych poleceń języka T-SQL, które mogą definiować obiekty danych i wykonywać względem niego zapytania, ale nie manipulować danymi z punktu końcowego analizy SQL, ponieważ jest to kopia tylko do odczytu. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Zapoznaj się z tabelami, które odwołują się do danych w tabelach usługi Delta Lake z usługi Snowflake.
  • Tworzenie żadnych zapytań i widoków kodu oraz eksplorowanie danych wizualnie bez konieczności pisania wiersza kodu.
  • Twórz widoki SQL, wbudowane funkcje TVF (funkcje z wartościami tabel) i procedury składowane w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów.
  • Wykonywanie zapytań o dane w innych magazynach i magazynach Lakehouse w tym samym obszarze roboczym.

Oprócz edytora zapytań SQL istnieje szeroki ekosystem narzędzi, które mogą wykonywać zapytania dotyczące punktu końcowego analizy SQL, w tym programu SQL Server Management Studio (SSMS), rozszerzenia mssql z programem Visual Studio Code, a nawet usługi GitHubCopilot.

Zagadnienia dotyczące zabezpieczeń

Aby włączyć dublowanie sieci szkieletowej, musisz mieć uprawnienia użytkownika dla bazy danych Snowflake, która zawiera następujące uprawnienia:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Aby uzyskać więcej informacji, zobacz dokumentację usługi Snowflake dotyczącą uprawnień kontroli dostępu dla tabel przesyłania strumieniowego i Wymaganych uprawnień dla strumieni.

Ważne

Wszelkie szczegółowe zabezpieczenia ustanowione w źródłowym magazynie Snowflake muszą zostać ponownie skonfigurowane w dublowanej bazie danych w usłudze Microsoft Fabric. Aby uzyskać więcej informacji, zobacz Szczegółowe uprawnienia sql w usłudze Microsoft Fabric.

Zagadnienia dotyczące kosztów dublowania płatka śniegu

Sieć szkieletowa nie pobiera opłat za ruch przychodzący danych sieciowych do usługi OneLake na potrzeby dublowania. Nie ma żadnych kosztów dublowania, gdy dane usługi Snowflake są replikowane do usługi OneLake.

Podczas dublowania danych istnieją koszty obliczeń usługi Snowflake i zapytań w chmurze: zasoby obliczeniowe magazynu wirtualnego i usługi w chmurze.

  • Opłaty za zasoby obliczeniowe magazynu wirtualnego snowflake:
    • Opłaty za obliczenia będą naliczane po stronie usługi Snowflake, jeśli istnieją zmiany danych odczytywane w usłudze Snowflake, a z kolei są dublowane w usłudze Fabric.
    • Wszystkie zapytania metadanych są uruchamiane w tle, aby sprawdzić, czy zmiany danych nie są naliczane za żadne obliczenia snowflake; jednak zapytania, które generują dane, takie jak a SELECT * , wznawiają magazyn Snowflake i będą naliczane opłaty za obliczenia.
  • Opłaty za obliczenia usług Snowflake:
    • Chociaż nie ma żadnych opłat za obliczenia dla zadań w tle, takich jak tworzenie, zapytania metadanych, kontrola dostępu, wyświetlanie zmian danych, a nawet zapytania DDL, istnieją koszty chmury związane z tymi zapytaniami.
    • W zależności od typu posiadanej wersji Snowflake opłata zostanie naliczona za odpowiednie środki za wszelkie koszty usług w chmurze.

Na poniższym zrzucie ekranu przedstawiono koszty obliczeń magazynu wirtualnego i usług w chmurze dla skojarzonej bazy danych Snowflake, która jest dublowana w sieci szkieletowej. W tym scenariuszu większość kosztów obliczeniowych usług w chmurze (w kolorze żółtym) pochodzi z zapytań dotyczących zmian danych w oparciu o wymienione wcześniej punkty. Opłaty za obliczenia magazynu wirtualnego (w kolorze niebieskim) pochodzą ściśle ze zmian danych są odczytywane z usługi Snowflake i dublowane w usłudze Fabric.

Zrzut ekranu przedstawiający wykres kosztów usługi Snowflake.

Aby uzyskać więcej informacji na temat kosztów zapytań dotyczących chmury specyficznych dla usługi Snowflake, zobacz Dokumentację usługi Snowflake: Omówienie ogólnego kosztu.

Następny krok