Einführung
Die Grundlage von Microsoft Fabric ist ein Lakehouse, das auf der skalierbaren Speicherschicht von OneLake basiert und die Apache Spark- und SQL-Compute-Engines für die Big-Data-Verarbeitung verwendet. Ein Lakehouse ist eine vereinheitlichte Plattform, die Folgendes kombiniert:
- Die flexible und skalierbare Speicherung eines Data Lake
- Die Möglichkeit, Daten aus einem Data Warehouse abzufragen und zu analysieren
Stellen Sie sich vor, dass Ihr Unternehmen ein Data Warehouse verwendet hat, um strukturierte Daten aus seinen Transaktionssystemen zu speichern, z. B. Bestellverlauf, Lagerbestand und Kundeninformationen. Sie haben unstrukturierte Daten aus sozialen Medien, Websiteprotokollen und externen Quellen gesammelt, die mit der vorhandenen Data-Warehouse-Infrastruktur schwierig zu verwalten und zu analysieren sind. Das neue Ziel Ihres Unternehmens besteht darin, die Entscheidungsfindung zu verbessern, indem Daten in verschiedenen Formaten quellübergreifend analysiert werden. Deshalb hat sich das Unternehmen für Microsoft Fabric entschieden.
In diesem Modul wird untersucht, wie ein Lakehouse in Microsoft Fabric einen skalierbaren und flexiblen Datenspeicher für Dateien und Tabellen bereitstellt, der mit SQL abgefragt werden kann.