Wprowadzenie do samouczka magazynu danych
Dotyczy:✅ punkt końcowy analizy SQL i magazyn w usłudze Microsoft Fabric
Usługa Microsoft Fabric zapewnia jednorazowy sklep dla wszystkich potrzeb analitycznych dla każdego przedsiębiorstwa. Obejmuje pełne spektrum usług, w tym przenoszenie danych, usług data lake, inżynierię danych, integrację danych i naukę o danych, analizę w czasie rzeczywistym i analizę biznesową. W przypadku usługi Microsoft Fabric nie ma potrzeby łączenia różnych usług od wielu dostawców. Zamiast tego klient cieszy się kompleksowym, wysoce zintegrowanym, kompleksowym produktem, który jest łatwy do zrozumienia, dołączania, tworzenia i obsługi. Żaden inny produkt na rynku nie oferuje szerokości, głębi i poziomu integracji, które oferuje microsoft Fabric. Ponadto usługa Microsoft Purview jest domyślnie uwzględniana w każdej dzierżawie w celu spełnienia wymagań dotyczących zgodności i ładu.
Cel tego samouczka
Chociaż wiele pojęć w usłudze Microsoft Fabric może być znanych specjalistom ds. danych i analiz, może być trudne, aby zastosować te pojęcia w nowym środowisku. Ten samouczek został zaprojektowany tak, aby przejść krok po kroku od kompleksowego scenariusza z pozyskiwania danych do użycia danych, aby stworzyć podstawową wiedzę na temat środowiska użytkownika usługi Microsoft Fabric, różnych środowisk i punktów integracji oraz środowiska deweloperów profesjonalnych i obywatelskich usługi Microsoft Fabric.
Samouczki nie mają być architekturą referencyjną, wyczerpującą listą funkcji i funkcjonalności ani zaleceniem określonych najlepszych rozwiązań.
Scenariusz kompleksowego magazynu danych
W ramach wymagań wstępnych dla tego samouczka wykonaj następujące czynności:
- Zaloguj się do konta online usługi Power BI lub jeśli nie masz jeszcze konta, utwórz konto w celu uzyskania bezpłatnej wersji próbnej.
- Włącz usługę Microsoft Fabric w dzierżawie.
W tym samouczku pełnisz rolę dewelopera magazynu w fikcyjnej firmie Wide World Importers i wykonaj następujące kroki w portalu usługi Microsoft Fabric, aby utworzyć i wdrożyć kompleksowe rozwiązanie magazynu danych:
- Utwórz obszar roboczy usługi Microsoft Fabric.
- Utwórz magazyn.
- Pozyskiwanie danych ze źródła do modelu wymiarowego magazynu danych przy użyciu potoku danych.
- Tworzenie tabel w magazynie.
- Ładowanie danych przy użyciu języka T-SQL za pomocą edytora zapytań SQL.
- Sklonuj tabelę przy użyciu języka T-SQL z edytorem zapytań SQL.
- Przekształć dane w celu utworzenia zagregowanych zestawów danych przy użyciu języka T-SQL.
- Podróż w czasie przy użyciu języka T-SQL w celu wyświetlenia danych w miarę ich wyświetlania.
- Użyj edytora zapytań wizualnych, aby wysłać zapytanie do magazynu danych.
- Analizowanie danych za pomocą notesu.
- Tworzenie i wykonywanie zapytań między magazynami za pomocą edytora zapytań SQL.
- Tworzenie raportów usługi Power BI przy użyciu trybu DirectLake w celu analizowania danych.
- Skompiluj raport z centrum danych OneLake.
- Wyczyść zasoby , usuwając obszar roboczy i inne elementy.
Kompleksowa architektura magazynu danych
Źródła danych — usługa Microsoft Fabric ułatwia i szybkie łączenie się z usługami Azure Data Services, innymi platformami w chmurze i lokalnymi źródłami danych w celu pozyskiwania danych z.
Pozyskiwanie — dzięki łącznikom natywnym 200+ w ramach potoku usługi Microsoft Fabric oraz przekształceniu danych przeciągania i upuszczania przy użyciu przepływu danych można szybko tworzyć szczegółowe informacje dla organizacji. Skrót to nowa funkcja w usłudze Microsoft Fabric, która umożliwia łączenie się z istniejącymi danymi bez konieczności kopiowania ani przenoszenia. Więcej szczegółów na temat funkcji Skrót można znaleźć w dalszej części tego samouczka.
Przekształcanie i przechowywanie — usługa Microsoft Fabric standandalizuje format usługi Delta Lake, co oznacza, że wszystkie aparaty usługi Microsoft Fabric mogą odczytywać i pracować nad tymi samymi danymi przechowywanymi w usłudze OneLake — nie ma potrzeby duplikowania danych. Ten magazyn umożliwia tworzenie magazynu danych lub siatki danych na podstawie potrzeb organizacji. W przypadku transformacji możesz wybrać środowisko z małą ilością kodu lub bez kodu z potokami/przepływami danych lub użyć języka T-SQL w celu uzyskania pierwszego środowiska kodu.
Wykorzystanie — dane z magazynu mogą być używane przez usługę Power BI, wiodące w branży narzędzie do analizy biznesowej na potrzeby raportowania i wizualizacji. Każdy magazyn zawiera wbudowany punkt końcowy TDS umożliwiający łatwe nawiązywanie połączenia z danymi i wykonywanie zapytań względem nich z innych narzędzi raportowania w razie potrzeby. Po utworzeniu magazynu element pomocniczy nazywany domyślnym modelem semantycznym jest generowany w tym samym czasie o tej samej nazwie. Możesz użyć domyślnego modelu semantycznego, aby rozpocząć wizualizowanie danych za pomocą zaledwie kilku kroków.
Przykładowe dane
W przypadku przykładowych danych używamy przykładowej bazy danych Wide World Importers (WWI). W naszym scenariuszu kompleksowego magazynu danych wygenerowaliśmy wystarczające dane, aby zajrzeć do możliwości skalowania i wydajności platformy Microsoft Fabric.
Wide World Importers (WWI) to hurtowy importer towarów nowości i dystrybutor działający z obszaru Zatoki San Francisco. Jako hurtownik klienci WWI są głównie firmami, które odsprzedają się osobom fizycznym. WWI sprzedaje klientom detalicznym w Stany Zjednoczone, w tym sklepy specjalne, supermarkety, sklepy obliczeniowe, sklepy turystyczne i niektóre osoby. WWI sprzedaje również innym hurtowniom za pośrednictwem sieci agentów, którzy promują produkty w imieniu WWI. Aby uzyskać więcej informacji na temat profilu i operacji firmy, zobacz Przykładowe bazy danych Wide World Importers dla usługi Microsoft SQL.
Zazwyczaj dane można przenieść z systemów transakcyjnych (lub aplikacji biznesowych) do obszaru przejściowego magazynu danych lub typu data lake. Na potrzeby tego samouczka używamy jednak modelu wymiarowego dostarczonego przez WWI jako naszego początkowego źródła danych. Używamy go jako źródła do pozyskiwania danych do magazynu danych i przekształcania ich za pomocą języka T-SQL.
Model danych
Chociaż model wymiarowy WWI zawiera wiele tabel faktów, w tym samouczku skupimy się tylko na fact_sale
tabeli i powiązanych wymiarach, jak pokazano poniżej, aby zademonstrować ten scenariusz kompleksowego magazynu danych: