Udostępnij za pośrednictwem


Przewodnik po decyzjach usługi Microsoft Fabric: wybór między magazynem a usługą Lakehouse

Usługa Microsoft Fabric oferuje dwa obciążenia w otwartym formacie standardowym dla przechowywania danych w skali przedsiębiorstwa: Warehouse i Lakehouse. W tym artykule porównamy dwie platformy i punkty decyzyjne dla każdego z nich.

Kryterium

Diagram zawierający drzewa decyzyjne dla Lakehouse i Warehouse w Microsoft Fabric.

Rozwiązania No Code lub Pro Code: Jak chcesz się rozwijać?

  • Iskra
    • Użyj Lakehouse
  • Język T-SQL
    • Użyj magazynu

potrzeby magazynowania: Czy potrzebujesz transakcji obejmujących wiele tabel?

  • Tak
    • Użyj magazynu
  • Nie
    • Użyj Lakehouse

Złożoność danych: jakiego typu dane analizujesz?

  • Nie wiem
    • Użyj Lakehouse
  • Dane nieustrukturyzowane i ustrukturyzowane
    • Użyj Lakehouse
  • Tylko dane ustrukturyzowane
    • Użyj magazynu

Wybieranie usługi kandydata

Wykonaj szczegółową ocenę usługi, aby potwierdzić, że spełnia twoje potrzeby.

Element magazynu w usłudze Fabric Data Warehouse to magazyn danych w skali przedsiębiorstwa o otwartym formacie standardowym.

  • Działanie bez konieczności regulacji przy minimalnej konfiguracji i wdrożeniu, bez potrzeby konfigurowania zasobów obliczeniowych ani pamięci masowej. ​
  • Proste i intuicyjne doświadczenia z magazynowaniem dla zarówno początkujących, jak i doświadczonych specjalistów ds. przetwarzania danych (bez potrzeby użycia kodu/bez konieczności programowania).
  • Magazyn skoncentrowany na jeziorze przechowuje dane w usłudze OneLake w otwartym formacie Delta, umożliwiając łatwe odzyskiwanie i zarządzanie danymi.
  • W pełni zintegrowana ze wszystkimi obciążeniami Fabric.
  • Ładowanie i przekształcanie danych na dużą skalę z pełnymi gwarancjami transakcyjnymi obejmującymi wiele tabel, zapewnianymi przez silnik SQL.
  • Magazyny wirtualne z zapytaniami między bazami danych i w pełni zintegrowaną warstwą semantyczną.
  • Platforma gotowa do użytku w przedsiębiorstwach z kompleksową widocznością wydajności i użycia, z wbudowanym zarządzaniem i zabezpieczeniami.
  • Elastyczność tworzenia magazynu danych lub siatki danych na podstawie potrzeb organizacyjnych i wyboru braku kodu, niskiego poziomu kodu lub języka T-SQL na potrzeby przekształceń.

Element Lakehouse w Fabric Data Engineering to platforma architektury danych służąca do przechowywania, zarządzania i analizowania danych strukturalnych i nieustrukturyzowanych w jednej lokalizacji.

  • Przechowywanie i analizowanie danych ustrukturyzowanych i nieustrukturyzowanych oraz zarządzanie nimi w jednej lokalizacji w celu uzyskania szczegółowych informacji i szybszego i wydajnego podejmowania decyzji.
  • Elastyczne i skalowalne rozwiązanie, które umożliwia organizacjom obsługę dużych ilości danych wszystkich typów i rozmiarów.
  • Łatwe pobieranie danych z wielu różnych źródeł, które są przekształcane do ujednoliconego formatu Delta.
  • Automatyczne odnajdywanie i rejestrowanie tabel w celu uzyskania w pełni zarządzanego środowiska przekształcania plików na tabele dla inżynierów danych i naukowców danych. ​
  • Automatyczny punkt końcowy analizy SQL i domyślny zestaw danych, który umożliwia wykonywanie zapytań dotyczących tabel różnicowych w usłudze Lake w języku T-SQL

Oba są uwzględnione w pojemnościach usługi Power BI Premium lub Fabric.

Porównanie różnych możliwości magazynowania

Ta tabela porównuje magazyn z punktem końcowym analizy SQL usługi Lakehouse.

Oferta Microsoft Fabric

Magazyn

punkt końcowy analizy SQL w Lakehouse


Podstawowe możliwości

Zgodne ze standardem ACID pełne magazynowanie danych z obsługą transakcji w języku T-SQL.

Tylko do odczytu, system wygenerował punkt końcowy analizy SQL dla usługi Lakehouse na potrzeby wykonywania zapytań i obsługi języka T-SQL. Obsługuje analizy na tabelach Delta w Lakehouse oraz w folderach Delta Lake, do których odniesienia są tworzone za pomocą skrótów i.


Profil dewelopera

Deweloperzy sql lub deweloperzy obywateli

Inżynierowie danych lub deweloperzy SQL


Ładowanie danych

SQL, potoki danych, przepływy danych

Spark, rurociągi danych, przepływy danych, skróty


Obsługa tabeli Delta

Odczytuje i zapisuje tabele Delta

Odczytuje tabele Delta


Warstwa przechowywania

Otwarty format danych — Delta

Otwarty format danych – Delta


Zalecany przypadek użycia

  • Magazynowanie danych do użytku w przedsiębiorstwie
  • Magazynowanie danych obsługujące działy, jednostki biznesowe lub użytkowanie samoobsługowe
  • Analiza danych strukturalnych w języku T-SQL z tabelami, widokami, procedurami i funkcjami oraz zaawansowaną obsługą języka SQL dla analizy biznesowej
  • Eksplorowanie i wykonywanie zapytań dotyczących tabel delta z lakehouse.
  • Dane przejściowe i strefa archiwalna na potrzeby analizy
  • architektura Medallion Lakehouse ze strefami do analizy brązu, srebra i złota
  • Łączenie z hurtownią danych na potrzeby analizowania na poziomie przedsiębiorstwa

Doświadczenie w rozwoju

  • Edytor magazynu z pełną obsługą pozyskiwania danych T-SQL, modelowania, programowania i wykonywania zapytań w interfejsie użytkownika na potrzeby pozyskiwania, modelowania i wykonywania zapytań dotyczących danych
  • Obsługa odczytu/zapisu dla narzędzi 1 i 3 firm
  • Punkt końcowy analizy SQL usługi Lakehouse z ograniczoną obsługą języka T-SQL dla widoków, funkcji wartości tabeli i zapytań SQL
  • Środowiska interfejsu użytkownika do modelowania i wykonywania zapytań
  • Ograniczona obsługa T-SQL dla narzędzi pierwszych i firm trzecich

Możliwości języka T-SQL

Pełna obsługa DQL, DML, DDL w T-SQL oraz pełna obsługa transakcji

Pełna obsługa języka DQL, brak DML, ograniczona obsługa języka T-SQL języka DDL, takich jak widoki SQL i pliki TVF