Udostępnij za pośrednictwem


Co to jest magazynowanie danych w usłudze Microsoft Fabric?

Dotyczy:✅ punkt końcowy analizy SQL i magazyn w usłudze Microsoft Fabric

Microsoft Fabric to rozwiązanie do magazynowania danych nowej generacji w usłudze Microsoft Fabric.

Magazyn skoncentrowany na jeziorze jest oparty na rozproszonym aucie przetwarzania klasy korporacyjnej, który umożliwia wiodącą w branży wydajność na dużą skalę przy jednoczesnym zminimalizowaniu potrzeby konfiguracji i zarządzania. Życie w usłudze Data Lake i zaprojektowane tak, aby natywnie obsługiwało otwarte formaty danych, magazyn danych sieci Szkieletowej umożliwia bezproblemową współpracę między inżynierami danych i użytkownikami biznesowymi bez naruszania zabezpieczeń i ładu.

Łatwe w użyciu środowisko SaaS jest również ściśle zintegrowane z usługą Power BI w celu łatwej analizy i raportowania, zbieżności świata magazynów i magazynów danych oraz znacznie upraszczania inwestycji organizacji w ich majątek analityczny. 

Klienci magazynu danych korzystają z następujących korzyści:

  • Dane przechowywane w formacie delta-parquet umożliwiają transakcje ACID i współdziałanie z innymi obciążeniami sieci szkieletowej oznacza, że nie potrzebujesz wielu kopii danych.
  • Zapytania obejmujące wiele baz danych mogą używać wielu źródeł danych do szybkiego wglądu w szczegółowe dane z zerowymi duplikacjami danych.
  • Łatwe pozyskiwanie, ładowanie i przekształcanie danych na dużą skalę za pomocą potoków, przepływów danych, zapytania między bazami danych lub polecenia COPY INTO.
  • Autonomiczne zarządzanie obciążeniami z wiodącym w branży aparatem przetwarzania zapytań rozproszonych nie oznacza, że żadne pokrętła nie zwracają się do osiągnięcia najlepszej wydajności klasy.
  • Skalowanie niemal natychmiast w celu spełnienia wymagań biznesowych. Magazyn i obliczenia są oddzielone.
  • Skrócony czas uzyskiwania szczegółowych informacji dzięki łatwemu w użyciu, zawsze połączonemu modelowi semantycznemu zintegrowanemu z usługą Power BI w trybie Direct Lake. Raporty zawsze zawierają najnowsze dane do analizy i raportowania.
  • Utworzony dla dowolnego poziomu umiejętności od dewelopera obywatela do administratora bazy danych lub inżyniera danych.

Elementy magazynowania danych

Magazyn danych sieci szkieletowej nie jest tradycyjnym magazynem danych przedsiębiorstwa, jest to magazyn lake, który obsługuje dwa odrębne elementy magazynowania: magazyn danych sieci szkieletowej i punkt końcowy analizy SQL. Oba są zaprojektowane specjalnie w celu zaspokojenia potrzeb biznesowych klientów, zapewniając jednocześnie najlepszą wydajność klasy, minimalizując koszty i zmniejszając nakład pracy administracyjnej.

Magazyn danych sieci szkieletowej

W obszarze roboczym usługi Microsoft Fabric magazyn sieci szkieletowej jest oznaczony jako Magazyn w kolumnie Typ . Jeśli potrzebujesz pełnej mocy i możliwości transakcyjnych (obsługa zapytań DDL i DML) magazynu danych, jest to szybkie i proste rozwiązanie.

Zrzut ekranu przedstawiający typ magazynu w obszarze roboczym.

Magazyn może być wypełniany przez jedną z obsługiwanych metod pozyskiwania danych, takich jak COPY INTO, Pipelines, Dataflows lub cross database ingestion options, np. CREATE TABLE AS SELECT (CTAS), INSERT.. WYBIERZ LUB WYBIERZ DO.

Aby rozpocząć pracę z magazynem, zobacz:

Punkt końcowy analizy SQL usługi Lakehouse

W obszarze roboczym usługi Microsoft Fabric każda usługa Lakehouse ma automatycznie wygenerowany "punkt końcowy analizy SQL", który może służyć do przejścia z widoku "Lake" usługi Lakehouse (obsługującego inżynierię danych i platformę Apache Spark) do widoku "SQL" tego samego magazynu Lakehouse w celu tworzenia widoków, funkcji, procedur składowanych i stosowania zabezpieczeń SQL.

Zrzut ekranu przedstawiający typ punktu końcowego analizy SQL w obszarze roboczym.

Za pomocą punktu końcowego analizy SQL usługi Lakehouse polecenia języka T-SQL mogą definiować i wykonywać zapytania o obiekty danych, ale nie manipulować ani modyfikować danych. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Wykonywanie zapytań względem tabel odwołujących się do danych w folderach usługi Delta Lake w usłudze Lake.
  • Tworzenie widoków, wbudowanych funkcji TVF i procedur w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów.

Aby rozpocząć pracę z punktem końcowym analizy SQL, zobacz:

Magazyn lub jezioro

Podczas podejmowania decyzji dotyczących korzystania z magazynu lub magazynu typu lakehouse należy wziąć pod uwagę konkretne potrzeby i kontekst wymagań związanych z zarządzaniem danymi i analizą. Równie ważne, to nie jest jedna decyzja!

Zawsze masz możliwość dodania jednego lub drugiego w późniejszym momencie, jeśli potrzeby biznesowe zmienią się i niezależnie od tego, gdzie się rozpoczniesz, zarówno magazyn, jak i lakehouse używają tego samego zaawansowanego aparatu SQL dla wszystkich zapytań T-SQL.

Poniżej przedstawiono kilka ogólnych wskazówek, które pomogą Ci w podjęciu decyzji:

  • Wybierz magazyn danych, gdy potrzebujesz rozwiązania w skali przedsiębiorstwa z otwartym standardowym formatem, bez wydajności pokrętła i minimalnej konfiguracji.  Najlepiej nadaje się do obsługi częściowo ustrukturyzowanych i ustrukturyzowanych formatów danych, magazyn danych jest odpowiedni zarówno dla początkujących, jak i doświadczonych specjalistów ds. danych, oferując proste i intuicyjne środowiska.

  • Wybierz usługę Lakehouse , gdy potrzebujesz dużego repozytorium wysoce nieustrukturyzowanych danych ze źródeł heterogenicznych, korzystając z magazynu obiektów o niskich kosztach i chcesz użyć platformy SPARK jako podstawowego narzędzia programistycznego. Działając jako "lekki" magazyn danych, zawsze możesz używać punktów końcowych SQL i narzędzi T-SQL do dostarczania scenariuszy raportowania i analizy danych w usłudze Lakehouse.

Aby uzyskać bardziej szczegółowe wskazówki dotyczące podejmowania decyzji, zobacz Przewodnik po decyzjach usługi Microsoft Fabric: Wybieranie między magazynem i usługą Lakehouse.