Modelowanie wymiarowe w usłudze Microsoft Fabric Warehouse
Dotyczy:✅ punkt końcowy analizy SQL i magazyn w usłudze Microsoft Fabric
Ten artykuł jest pierwszym z serii o modelowaniu wymiarowym wewnątrz magazynu. Zawiera praktyczne wskazówki dotyczące magazynu w usłudze Microsoft Fabric, które jest środowiskiem obsługującym wiele funkcji języka T-SQL, takich jak tworzenie tabel i zarządzanie danymi w tabelach. W związku z tym masz pełną kontrolę nad tworzeniem tabel modelu wymiarowego i ładowaniem ich przy użyciu danych.
Uwaga
W tym artykule termin magazyn danych odnosi się do magazynu danych przedsiębiorstwa, który zapewnia kompleksową integrację krytycznych danych w całej organizacji. Z kolei autonomiczny magazyn terminów odnosi się do magazynu sieci szkieletowej, który jest oprogramowaniem jako usługą (SaaS) ofertą relacyjnej bazy danych, której można użyć do zaimplementowania magazynu danych. Aby uzyskać jasność, w tym artykule ten ostatni jest wymieniony jako Magazyn sieci szkieletowej.
Napiwek
Jeśli nie masz doświadczenia z modelowaniem wymiarowym, weź pod uwagę, że ta seria artykułów jest pierwszym krokiem. Nie jest ona przeznaczona do pełnej dyskusji na temat projektowania modelowania wymiarowego. Aby uzyskać więcej informacji, zapoznaj się bezpośrednio z powszechnie opublikowaną zawartością, na przykład The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (trzeci wydanie, 2013) autorstwa Ralph Kimball i innych.
Projekt schematu gwiazdy
Schemat gwiazdy to technika projektowania modelowania wymiarowego przyjęta przez magazyny danych relacyjnych. Jest to zalecane podejście projektowe, które należy wykonać podczas tworzenia magazynu sieci szkieletowej. Schemat gwiazdy składa się z tabel faktów i tabel wymiarów.
- Tabele wymiarów opisują jednostki istotne dla organizacji i wymagań analitycznych. Zasadniczo reprezentują one elementy, które modelujesz. Mogą to być produkty, osoby, miejsca lub inne pojęcia, w tym data i godzina. Aby uzyskać więcej informacji i najlepsze rozwiązania dotyczące projektowania, zobacz Tabele wymiarów w tej serii.
- Tabele faktów przechowują miary skojarzone z obserwacjami lub zdarzeniami. Mogą przechowywać zamówienia sprzedaży, salda zapasów, kursy wymiany, odczyty temperatury i nie tylko. Tabele faktów zawierają klucze wymiarów wraz z szczegółowymi wartościami, które można agregować. Aby uzyskać więcej informacji i zaprojektować najlepsze rozwiązania, zobacz Tabele faktów w tej serii.
Projekt schematu gwiazdy jest zoptymalizowany pod kątem obciążeń analitycznych zapytań. Z tego powodu jest to uważane za wymaganie wstępne dla modeli semantycznych usługi Power BI w przedsiębiorstwie. Zapytania analityczne dotyczą filtrowania, grupowania, sortowania i podsumowywania danych. Dane faktów są sumowane w kontekście filtrów i grup powiązanych tabel wymiarów.
Powodem, dla którego jest nazywany schemat gwiazdy, jest to, że tabela faktów tworzy środek gwiazdy, podczas gdy powiązane tabele wymiarów tworzą punkty gwiazdy.
Schemat gwiazdy często zawiera wiele tabel faktów, a tym samym wiele gwiazdek.
Dobrze zaprojektowany schemat gwiazdy zapewnia wysoką wydajność (relacyjne) zapytania z powodu mniejszej liczby sprzężeń tabel i większe prawdopodobieństwo przydatnych indeksów. Ponadto schemat gwiazdy często wymaga niskiej konserwacji w miarę rozwoju projektu magazynu danych. Na przykład dodanie nowej kolumny do tabeli wymiarów w celu obsługi analizy przez nowy atrybut jest stosunkowo prostym zadaniem do wykonania. Podobnie jak dodawanie nowych faktów i wymiarów w miarę rozwoju zakresu magazynu danych.
Okresowo, być może codziennie, tabele w modelu wymiarowym są aktualizowane i ładowane przez proces wyodrębniania, przekształcania i ładowania (ETL). Ten proces synchronizuje dane z systemami źródłowymi, które przechowują dane operacyjne. Aby uzyskać więcej informacji, zobacz Ładowanie tabel w tej serii.
Modelowanie wymiarowe dla usługi Power BI
W przypadku rozwiązań dla przedsiębiorstw model wymiarowy w magazynie sieci szkieletowej jest zalecanym wymaganiem wstępnym do utworzenia modelu semantycznego usługi Power BI. Model wymiarowy nie tylko obsługuje model semantyczny, ale jest również źródłem danych dla innych środowisk, takich jak modele uczenia maszynowego.
Jednak w określonych okolicznościach może to nie być najlepsze podejście. Na przykład analitycy samoobsługi, którzy potrzebują swobody i elastyczności, aby działać szybko i bez zależności od IT, mogą tworzyć semantyczne modele łączące się bezpośrednio z danymi źródłowymi. W takich przypadkach teoria modelowania wymiarowego jest nadal istotna. Teoria ta pomaga analitykom tworzyć intuicyjne i wydajne modele, unikając jednocześnie konieczności tworzenia i ładowania modelu wymiarowego w magazynie danych. Zamiast tego można utworzyć model quasi-wymiarowy przy użyciu dodatku Power Query, który definiuje logikę łączenia się i przekształcania danych źródłowych w celu utworzenia i załadowania tabel modelu semantycznego. Aby uzyskać więcej informacji, zobacz Omówienie schematu gwiazdy i znaczenia usługi Power BI.
Ważne
Jeśli używasz dodatku Power Query do definiowania modelu wymiarowego w modelu semantycznym, nie możesz zarządzać zmianami historycznymi, co może być konieczne do dokładnego przeanalizowania przeszłości. Jeśli jest to wymagane, należy utworzyć magazyn danych i zezwolić okresowym procesom ETL na przechwytywanie i odpowiednie przechowywanie zmian wymiarów.
Planowanie magazynu danych
Należy podejść do tworzenia magazynu danych i projektowania modelu wymiarów jako poważnego i ważnego przedsiębiorstwa. Dzieje się tak, ponieważ magazyn danych jest podstawowym składnikiem platformy danych. Powinna ona stanowić solidną podstawę, która obsługuje analizę i raportowanie — a w związku z tym podejmowanie decyzji — dla całej organizacji.
W tym celu magazyn danych powinien dążyć do przechowywania jakości, zgodności i historycznie dokładnych danych jako pojedynczej wersji prawdy. Powinny one dostarczać zrozumiałe i nawigowalne dane z szybką wydajnością i wymuszać uprawnienia, aby odpowiednie dane mogły być dostępne tylko dla odpowiednich osób. Staraj się projektować magazyn danych pod kątem odporności, co pozwala na dostosowanie się do zmian w miarę rozwoju wymagań.
Pomyślne wdrożenie magazynu danych zależy od dobrego planowania. Aby uzyskać informacje na temat zagadnień strategicznych i taktycznych oraz elementów akcji, które prowadzą do pomyślnego wdrożenia usługi Fabric i magazynu danych, zobacz plan wdrożenia usługi Microsoft Fabric.
Napiwek
Zalecamy iteracyjne tworzenie magazynu danych przedsiębiorstwa. Najpierw zacznij od najważniejszych obszarów tematycznych, a następnie z upływem czasu, zgodnie z priorytetem i zasobami, rozszerz magazyn danych o inne obszary podmiotu.
Powiązana zawartość
W następnym artykule z tej serii dowiesz się więcej o wskazówkach i projektowaniu najlepszych rozwiązań dotyczących tabel wymiarów.