Einführung in das Data Warehouse-Tutorial
Gilt für:✅ SQL-Analyseendpunkt und Warehouse in Microsoft Fabric
Microsoft Fabric bietet eine zentrale Anlaufstelle für alle analytischen Anforderungen von Unternehmen. Die Lösung deckt das gesamte Spektrum an Diensten ab (einschließlich Datenverschiebung, Data Lake, Datentechnik, Datenintegration und Data Science, Echtzeitanalysen und Business Intelligence). Mit Microsoft Fabric müssen keine verschiedenen Dienste von mehreren Anbietern kombiniert werden. Stattdessen können die Benutzer*innen auf ein umfassendes, hochgradig integriertes und einheitliches Produkt zurückgreifen, das leicht zu verstehen, integrieren, erstellen und verwalten ist. Kein anderes Produkt auf dem Markt bietet die Breite, Tiefe und Integrationsebene, die Microsoft Fabric bietet. Darüber hinaus ist Microsoft Purview standardmäßig in jedem Mandanten enthalten, um Compliance- und Governanceanforderungen zu erfüllen.
Zweck dieses Tutorials
Viele Konzepte in Microsoft Fabric sind Daten- und Analyseexpert*innen zwar bekannt, es kann jedoch schwierig sein, diese Konzepte in einer neuen Umgebung anzuwenden. Dieses Tutorial wurde entwickelt, um ein umfassendes Szenario von der Datenerfassung bis zur Datennutzung ausführlich zu erläutern, sodass die Benutzer*innen ein grundlegendes Verständnis der Microsoft Fabric-Benutzeroberfläche, der verschiedenen Funktionen und ihrer Integrationspunkte sowie der Microsoft Fabric-Umgebungen für Expert*innen und Citizen Developers erhalten.
Die Tutorials sind nicht als Referenzarchitektur, vollständige Liste von Features und Funktionen oder als Empfehlung bestimmter bewährter Methoden vorgesehen.
Umfassendes Data Warehouse-Szenario
Führen Sie als Voraussetzungen für dieses Tutorial die folgenden Schritte aus:
- Melden Sie sich bei Ihrem Power BI-Onlinekonto an. Falls Sie noch kein Konto besitzen, registrieren Sie sich für eine kostenlose Testversion.
- Aktivieren Sie Microsoft Fabric in Ihrem Mandanten.
In diesem Tutorial übernehmen Sie die Rolle einer Warehouse-Entwicklerin bzw. eines Warehouse-Entwicklers im fiktiven Unternehmen Wide World Importers und führen die folgenden Schritte im Microsoft Fabric-Portal aus, um eine umfassende Data Warehouse-Lösung zu erstellen und zu implementieren:
- Erstellen eines Microsoft Fabric-Arbeitsbereichs
- Erstellen eines Warehouse
- Erfassen von Daten aus Quellen im Data Warehouse-Dimensionsmodell mit einer Datenpipeline
- Erstellen von Tabellen in Ihrem Warehouse
- Laden von Daten mit T-SQL mit dem SQL-Abfrage-Editor
- Klonen Sie eine Tabelle mit T-SQL mit dem SQL-Abfrage-Editor.
- Transformieren der Daten zum Erstellen aggregierter Datasets mithilfe von T-SQL
- Ortswechsel in der angegebenen Zeit mit T-SQL, um Daten so anzuzeigen, wie sie angezeigt wurden.
- Verwenden des visuellen Abfrage-Editors zum Abfragen des Data Warehouse
- Analysieren von Daten mit einem Notebook
- Erstellen und Ausführen von Warehouse-übergreifenden Abfragen mit dem SQL-Abfrage-Editor
- Erstellen von Power BI-Berichten mithilfe des DirectLake-Modus zum Analysieren der verfügbaren Daten
- Erstellen Sie einen Bericht aus OneLake.
- Bereinigen von Ressourcen durch Löschen des Arbeitsbereichs und anderer Elemente
Umfassende Data Warehouse-Architektur
Datenquellen: Mit Microsoft Fabric lassen sich einfach und schnell Verbindungen mit Azure Data Services, anderen Cloudplattformen und lokalen Datenquellen herstellen, aus denen Daten erfasst werden sollen.
Erfassung: Mit mehr als 200 nativen Connectors als Teil der Microsoft Fabric-Pipeline und der Datentransformation per Drag-and-Drop-Vorgängen mit Dataflow können Sie schnell Erkenntnisse für Ihre Organisation erhalten. Mit dem neuen Verknüpfungsfeature in Microsoft Fabric können Sie eine Verbindung mit vorhandenen Daten herstellen, ohne dabei Daten kopieren oder verschieben zu müssen. Weitere Informationen zum Verknüpfungsfeature finden Sie weiter unten in diesem Tutorial.
Transformieren und Speichern: Microsoft Fabric standardisiert das Delta Lake-Format. Dies bedeutet, dass alle Engines von Microsoft Fabric dieselben in OneLake gespeicherten Daten lesen und bearbeiten können, sodass Daten nicht dupliziert werden müssen. Mit diesem Speicher können Sie ein Data Warehouse oder ein Data Mesh basierend auf den Anforderungen Ihrer Organisation erstellen. Für die Transformation können Sie entweder einen Low-Code- oder No-Code-Ansatz mit Pipelines bzw. Dataflows oder T-SQL für einen Code-First-Ansatz verwenden.
Verwendung: Daten aus dem Warehouse können zur Berichterstellung und Visualisierung vom branchenführenden Business Intelligence-Tool Power BI verwendet werden. Jedes Warehouse verfügt über einen integrierten TDS-Endpunkt, um bei Bedarf problemlos eine Verbindung mit anderen Berichtstools herzustellen und Daten von diesen abzufragen. Wenn ein Warehouse erstellt wird, wird gleichzeitig ein sekundäres Element mit demselben Namen generiert, das als Standardsemantikmodell bezeichnet wird. Sie können das Standardsemantikmodell verwenden, um mit der Visualisierung von Daten mit nur wenigen Schritten zu beginnen.
Beispieldaten
Für Beispieldaten wird die WWI-Beispieldatenbank (Wide World Importers) genutzt. Für das umfassende Data Warehouse-Szenario wurden genügend Daten generiert, um einen Einblick in die Skalierungs- und Leistungsfunktionen der Microsoft Fabric-Plattform zu erhalten.
Wide World Importers (WWI) ist ein Importeur und Großhändler von neuartigen Waren in der San Francisco Bay Area. Als Großhändler hat WWI hauptsächlich Unternehmen als Kunden, die an Einzelpersonen weiterverkaufen. WWI verkauft an Einzelhandelskunden in den USA. Zu ihnen gehören Fachgeschäfte, Supermärkte, Computergeschäfte, touristische Geschäfte und einige Einzelpersonen. WWI verkauft seine Produkte über Zwischenhändler, die die Produkte im Auftrag von WWI bewerben, auch an andere Großhändler. Weitere Informationen zum Unternehmensprofil und -betrieb finden Sie unter Wide World Importers-Beispieldatenbanken für Microsoft SQL.
In der Regel würden Sie Daten aus Transaktionssystemen (oder Branchenanwendungen) in einen Data Lake- oder Data Warehouse-Stagingbereich übertragen. In diesem Tutorial wird das von WWI bereitgestellte Dimensionsmodell als erste Datenquelle verwendet. Es wird als Quelle zum Erfassen der Daten in einem Data Warehouse und Transformieren der Daten über T-SQL verwendet.
Datenmodell
Während das WWI-Dimensionsmodell mehrere Faktentabellen enthält, liegt der Fokus in diesem Tutorial zur Veranschaulichung des End-to-End-Data Warehouse-Szenarios wie im Folgenden gezeigt nur auf der fact_sale
-Tabelle und den zugehörigen Dimensionen: