Neuerungen und Planungen für Data Warehouse in Microsoft Fabric
Wichtig
In den Freigabeplänen werden Funktionen beschrieben, die möglicherweise noch nicht freigegeben wurden. Die Liefer-Zeitachsen und die geplante Funktion können sich ändern oder werden möglicherweise nicht geliefert. Weitere Informationen finden Sie unter Microsoft-Richtlinie.
Data Warehouse in Microsoft Fabric ist das erste Data Warehouse, das Transaktionen mit mehreren Tabellen unterstützt und ein offenes Datenformat nativ verwendet. Das Warehouse basiert auf dem robusten SQL Server-Abfrageoptimierer und einem verteilten Abfrageverarbeitungsmodul auf Unternehmensniveau, das die Notwendigkeit von Konfiguration und Verwaltung beseitigt. Data Warehouse in Microsoft Fabric lässt sich nahtlos in Data Factory für Datenaufnahme, Power BI für Analyse und Berichterstellung sowie Synapse Spark für Data Science und maschinelles Lernen integrieren. Die Analyseinvestitionen einer Organisation werden optimiert, indem Data Lakes und Warehouses zusammenführt werden.
Data Warehousing-Workloads profitieren von den umfangreichen Funktionen der SQL-Engine über ein offenes Datenformat, sodass Kundinnen und Kunden sich auf Analysen und Berichte konzentrieren können. Sie profitieren auch vom Zugriff auf Daten aus OneLake, einem Data Lake Storage-Virtualisierungs-Dienst.
Weitere Informationen finden Sie in der Dokumentation.
Schwerpunkte
Aktualisierungen von Abfrageeinblicken
Geschätzter Zeitplan für die Veröffentlichung: Q4 2024
Versionstyp: Allgemeine Verfügbarkeit
Abfrageeinblicke stellen nun die Datenmenge dar, die während der Abfrageausführung gescannt wurde, spilt nach Arbeitsspeicher, Datenträger und Remote.
Copilot für Data Warehouse: Sidecar Chat
Geschätzter Zeitplan für die Veröffentlichung: Q4 2024
Versionstyp: Öffentliche Vorschau
Copilot für Data Warehouse ist der ultimative gekoppelte Programmierer und Produktivitätsverstärker für alle Kompetenzstufen-Entwickler – von Datenprofis bis hin zu Analysten. Es wurde entwickelt, um die Lagerentwicklung zu beschleunigen, indem er generative KI nutzt, um die Erstellung, Analyse und Verwaltung von Data Warehouse zu vereinfachen und zu automatisieren.
Dieses Feature führt den Copilot Sidecar-Chatbereich ein. Verwenden Sie den Chatbereich, um Fragen zu Ihrem Lagerhaus über natürliche Sprache zu Copilot zu stellen. Zu den Anwendungsfällen zählen:
- Natural Language to SQL: Stellen Sie Copilot eine Frage zu Ihren Warehouse-Daten und erhalten Sie eine generierte SQL-Abfrage, die auf Ihr Lagerschema zugeschnitten ist.
- F&A: Stellen Sie Copilot eine Frage zu Ihrem Lager und erhalten Sie eine dokumentbasierte Antwort und Zeiger auf offizielle Dokumentationen.
- Brainstorming: Verwenden Sie Copilot, um relevante Trends oder Muster zu brainstormen, um innerhalb Ihrer Daten zu analysieren.
BULK INSERT
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Die BULK INSERT-Anweisung wird zum Aufnehmen von Dateien in Fabric DW (ähnlich wie COPY INTO) verwendet. mit der BULK INERT-Funktion aktivieren wir die Migration von SQL Server zu Fabric DW mit minimalen Codeänderungen. Die Kunden müssten ihren Code und externe Tools neu schreiben, die BULK INSERT verwenden, um zu COPY INTO zu migrieren, als Voraussetzung für die Migration zu Fabric DW. Darüber hinaus unterstützen BULK INSERT einige herkömmliche lokale Optionen, die in COPY INTO nicht verfügbar sind.
OPENROWSET
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Fabric DW ermöglicht es den Benutzern, die OPENROWSET-Funktion zum Lesen von Daten aus den Dateien im See zu verwenden. Ein einfaches Beispiel für die OPENROWSET-Funktion ist:
SELECT *
FROM OPENROWSET ( BULK ‘<file path>’ )
WITH ( <column definition> )
Die OPENROWSET-Funktion liest den Inhalt der Datei(en) an der angegebenen Stelle <file path>
und gibt den Inhalt der Dateien zurück.
Thi-Funktion ermöglicht das einfache Durchsuchen und Anzeigen einer Vorschau der Dateien vor der Aufnahme.
Zwischenspeichern von Resultsets
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Das Zwischenspeichern von Resultset speichert die Ergebnisse anwendbarer Abfragen und gibt sie bei späteren Durchläufen sofort zurück. Dadurch wird die Ausführungszeit drastisch reduziert, da eine erneute Kompilierung und Berechnung entfällt. Der Cache wird automatisch verwaltet und erfordert keinen manuellen Eingriff.
Verbesserungen der automatischen Statistik
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
Verschiedene Verbesserungen sind geplant – kürzere Ausführungszeit für automatische Statistikaktualisierungen, opportunistische Unterstützung für VARCHAR(MAX)-Spaltentypen, verbesserte Speicherung von Zwischenstatistikschritten, automatische Statistikwartung außerhalb der Benutzerabfrage.
SHOWPLAN_XML
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
SHOWPLAN_XML gibt detaillierte Informationen dazu zurück, wie die Anweisungen in Form eines gut definierten XML-Dokuments ausgeführt werden, ohne die T-SQL-Anweisung auszuführen.
Copilot für SQL-Analyseendpunkt
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Copilot für Data Warehouse ist der ultimative gekoppelte Programmierer und Produktivitätsverstärker für alle Kompetenzstufen-Entwickler – von Datenprofis bis hin zu Analysten. Es wurde entwickelt, um die Lagerentwicklung zu beschleunigen, indem er generative KI nutzt, um die Erstellung, Analyse und Verwaltung von Data Warehouse zu vereinfachen und zu automatisieren. Dieses Feature ermöglicht die Copilot-Verwendung im SQL-Analyseendpunkt.
AKTUALISIEREN der REST-API des SQL Analytics-Endpunkts
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
Lösen Sie programmgesteuert eine Aktualisierung Ihres SQL-Analyseendpunkts aus, um Tabellen mit allen Änderungen, die im übergeordneten Element vorgenommen wurden, synchron zu halten.
Codemigrations-Assistent
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Um die Migration von SQL Server, Synapse dedizierten SQL-Pools und anderen Warehouses zum Fabric Data Warehouse zu beschleunigen, können Benutzer den Code und die Daten aus der Quelldatenbank migrieren, das Quellschema und den Code automatisch in Fabric Data Warehouse konvertieren, bei der Datenmigration helfen und KI-unterstützung bereitstellen.
Datenclustering
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Datenclustering ermöglicht eine schnellere Leseleistung, indem Kunden Spalten für die gemeinsame Suche von Daten bei der Erfassung angeben können, um das Überspringen von Dateien beim Lesen zu ermöglichen.
Tabelle ändern - Spalte ablegen/umbenennen
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
Alter Table – Drop/Rename ermöglicht Es Kunden, ihre Tabellendefinition durch Ablegen und Umbenennen von Spalten zu ändern. Dies ist zusätzlich zu vorhandenen Alter Table-Funktionen, die das Hinzufügen neuer Spalten unterstützen und heute in der Produktion sind.
Temporäre Tabellen (Sitzungsbereich)
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
Sitzungsbereichsbezogene, geparkte temporäre Tabellen ermöglichen Es Kunden, Zwischenergebnissätze für wiederholten Zugriff zu speichern, sind jedoch nicht erforderlich, dauerhaft zu speichern. Sie funktionieren als normale Permamenttabelle, verschwinden jedoch, wenn die Verbindung geschlossen wird.
MERGE (T-SQL)
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
Der BEFEHL MERGE T-SQL für Fabric Data Warehouse bringt die Leistungsfähigkeit von auswahlbasierter DML in eine einzelne Anweisung für alle Ihre Transformationslogikanforderungen.
SQL-Überwachungsprotokolle
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
Dieses Feature verfolgt Datenbankereignisse und schreibt sie in ein Überwachungsprotokoll, sodass Kunden die Überwachungsdatei mithilfe von sys.fn_get_audit_file_v2 zur Überwachung und Compliance abfragen können.
EXECUTE AS
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Allgemeine Verfügbarkeit
EXECUTE AS legt den Ausführungskontext für eine Sitzung fest und ermöglicht es dem Benutzer, die Identität eines anderen Benutzers zu überprüfen, die erforderlichen Berechtigungen zu überprüfen, die bereitgestellt wurden.
BCP
Geschätzter Zeitplan für die Veröffentlichung: Q1 2025
Versionstyp: Öffentliche Vorschau
Fabric DW unterstützt bcp-Hilfsprogramm und die TDS-Massenlade-API. Die Massen-Lod-API ermöglicht eine Vielzahl von Clienttools wie bcp, SSIS, ADF, zum Laden von Daten in Fabric DW. Ein Beispiel für bcp-Befehl, der einen Inhalt einer Datei in die DW-Tabelle lädt, lautet:
bcp gold.artists in "C:\temp\gold_artist.txt" -d TextDW -c -S "<server name>.msit-datawarehouse.fabric.microsoft.com" -G -U theusert@microsoft.com
Verfügbare Features
VARCHAR(MAX)/VARBINARY(MAX)-Typen
Ausgeliefert (Q4 2024)
Versionstyp: Öffentliche Vorschau
Benutzende können Spalten mit VARCHAR(MAX)/VARBINARY(MAX)-Typen in Data Warehouse definieren, um Zeichenfolgen- oder Binärdaten bis zu 1 MB zu speichern. Im SQL-Endpunkt für das Lakehouse werden die Zeichenfolgentypen in Delta-Tabellen ohne Abkürzung auf 8 KB als VARCHAR(MAX) dargestellt. Die Leistungsunterschiede zwischen den Abfragen, die mit VARCHAR(MAX)- und VARCHAR(8000)-Typen arbeiten, werden minimiert, sodass Benutzende große Typen ohne erhebliche Leistungseinbußen verwenden können.
Verbesserungen des SQL Analytics-Endpunkts
Ausgeliefert (Q4 2024)
Versionstyp: Allgemeine Verfügbarkeit
Dieses Feature umfasst Aktualisierungen an der SQL Analytics-Endpunktoberfläche, einschließlich:
- Automatische Aktualisierung ausgelöst beim Öffnen des Elements oder Herstellen einer Verbindung mit dem Endpunkt
- Verbesserte Benutzeroberfläche zum Aktualisieren des SQL-Analyseendpunkts direkt im Menüband
- Neue Eigenschaft für "Letzte erfolgreiche Aktualisierung" in OneLake über das Flyout "Tabelleneigenschaften"
- Verbesserte Fehlermeldungen
JSON-Unterstützung
Ausgeliefert (Q4 2024)
Versionstyp: Allgemeine Verfügbarkeit
Die JSON-Unterstützung in Fabric Datawarehouse ermöglicht die Verarbeitung von textbezogenen Daten, die als JSON-Text formatiert sind. Die neuen JSON-Features in Fabric DW sind:
- FOR JSON-Abfrageoption, die die Abfrageergebnisse als JSON-Text formatiert. Dies war eine der Features, die auf der Microsoft Fabric Idea-Website angefordert werden.
- JSON-Skalarfunktionen, die auch in der Azure SQL-Datenbank verwendet werden können. Zusätzlich zu den vorhandenen JSON-Skalarfunktionen (ISJSON, JSON_VALUE, JSON_QUERY und JSON_MODIFY) setzt Fabric DW die neuesten JSON-Funktionen, die in Azure SQL-Datenbank vorhanden sind – JSON_PATH_EXISTS, JSON_OBJECT und JSON_ARRAY.
Verbesserung der Zeichenfolgeleistung
Ausgeliefert (Q4 2024)
Versionstyp: Allgemeine Verfügbarkeit
Vorgänge für Zeichenfolgen (VARCHAR(N)) sind in T-SQL-Abfragen üblich. Leistungsverbesserungen bei Zeichenfolgenfunktionen und Operatoren, die mit Zeichenfolgen arbeiten, erhöhen die Leistung der Abfragen, die LIKE-Prädikate, Zeichenfolgenfunktionen und Vergleichsoperatoren in WHERE-Prädikaten und Operatoren wie GROUP BY, ORDER BY, JOIN verwenden, die mit Zeichenfolgentypen arbeiten.
Unterstützung der Sortierung ohne Groß-/Kleinschreibung (nur Lager)
Ausgeliefert (Q4 2024)
Versionstyp: Allgemeine Verfügbarkeit
Die Verwendung der öffentlichen REST-APIs zum Erstellen eines Data Warehouse umfasst eine neue Option zum Festlegen der Standardsortierung. Dies kann verwendet werden, um einen neuen Standardwert für die Sortierung ohne Groß-/Kleinschreibung festzulegen. Die beiden unterstützten Sortierungen sind Latin1_General_100_CI_AS_KS_WS_SC_UTF8 (Groß-/Kleinschreibung wird nicht beachtet) und Latin1_General_100_BIN2_UTF8 (Groß-/Kleinschreibung wird beachtet) und ist weiterhin unsere Standardeinstellung.
Die UNTERSTÜTZUNG von COLLATE T-SQL-Klauseln wird in Kürze verfügbar sein. Auf diese Weise können Sie den BEFEHL COLLATE mit CREATE oder ALTER TABLE verwenden, um die Sortierung für Ihre VARCHAR-Felder direkt anzugeben.
Geschachtelte CTE
Ausgeliefert (Q4 2024)
Common Table Expressions (CTE) erhöht die Lesbarkeit und Vereinfachung für komplexe Abfragen, indem komplexe Abfragen in einfache Blöcke decodiert und bei Bedarf wiederverwendet werden, anstatt die Abfrage neu zu schreiben. Eine geschachtelte CTE wird mit der Definition eines anderen CTE definiert.
T-SQL-Notebookintegration
Verfügbar (Q3 2024)
Versionstyp: Öffentliche Vorschau
Sie können mit der Verwendung der T-SQL-Sprachunterstützung in Notebooks beginnen, die die Leistungsfähigkeit von Notebooks und SQL innerhalb derselben Oberfläche kombiniert – die Aktivierung von IntelliSense, autoVervollständigen, datenbankübergreifende Abfragen, umfangreichere Visualisierungen und die Möglichkeit, mithilfe von Notebooks problemlos im Team zusammenzuarbeiten und sie gemeinsam zu nutzen.
TRUNCATE
Verfügbar (Q3 2024)
Mit dem Befehl „TRUNCATE“ werden schnell alle Datenzeilen aus einer Tabelle entfernt.
ALTER TABLE – Hinzufügen von nullbaren Spalten
Verfügbar (Q3 2024)
Unterstützung für ALTER TABLE ADD COLUMN, um bereits vorhandene Tabellen mit neuen Spalten zu erweitern, die NULL-Werte zulassen.
Aktualisierungen von Abfrageeinblicken
Verfügbar (Q3 2024)
Eine historische Ansicht Ihrer geschlossenen Sitzungen wird über Abfrageeinblicke zur Verfügung gestellt. Dadurch können Sie Datenverkehr, Last und Nutzung Ihrer DW analysieren.
Direkte Wiederherstellung im Warehouse-Editor
Verfügbar (Q2 2024)
Sie können jetzt problemlos Wiederherstellungspunkte erstellen und das Warehouse im Falle einer versehentlichen Beschädigung in einem bekannten guten Zustand wiederherstellen, indem Sie die Benutzeroberfläche des Warehouse-Editors verwenden.
COPY INTO-Unterstützung für sicheres Speichern
Verfügbar (Q2 2024)
Versionstyp: Öffentliche Vorschau
Sie können jetzt Daten in Ihr Warehouse aufnehmen, indem Sie COPY INTO aus einem externen Azure-Speicherkonto verwenden, das hinter einer Firewall geschützt ist.
Copilot
Verfügbar (Q2 2024)
Versionstyp: Öffentliche Vorschau
Copilot ermöglicht Entwickelnden jedes Qualifikationsniveaus, schnell ein Warehouse in Fabric zu erstellen und abzufragen. Copilot bietet Beratung und bewährte Methoden, AutoVervollständigen-Code, Hilfe beim Beheben und Dokumentieren von Code und bietet Unterstützung bei der Datenvorbereitung, Modellierung und Analyse.
Zeitreise
Verfügbar (Q2 2024)
Die Möglichkeit der Zeitreise auf T-SQL-Anweisungsebene ermöglicht es Benutzenden, historische Daten aus verschiedenen vergangenen Zeiträumen abzufragen, indem sie den Zeitstempel nur einmal für die gesamte Abfrage angeben. Durch die Verwendung einer einzigen Kopie der in One Lake vorhandenen Daten für die Durchführung historischer Trendanalysen, die Fehlerbehebung und den Datenabstimmung lassen sich durch Zeitreisen erhebliche Speicherkosten sparen. Darüber hinaus erleichtert es die Erstellung stabiler Berichte, indem es die Datenintegrität über verschiedene Tabellen innerhalb des Data Warehouse aufrechterhält.
Warehouse-Überwachungserfahrung
Verfügbar (Q2 2024)
Mit der integrierten Warehouse-Überwachung können Sie sowohl Live-Abfragen als auch historische Abfragen anzeigen, die Leistung ihrer End-to-End-Lösung überwachen und Fehler beheben.