Freigeben über


Neuerungen und Planungen für Data Warehouse in Microsoft Fabric

Wichtig

In den Freigabeplänen werden Funktionen beschrieben, die möglicherweise noch nicht freigegeben wurden. Die Liefer-Zeitachsen und die geplante Funktion können sich ändern oder werden möglicherweise nicht geliefert. Weitere Informationen finden Sie unter Microsoft-Richtlinie.

Data Warehouse in Microsoft Fabric ist das erste Data Warehouse, das Transaktionen mit mehreren Tabellen unterstützt und ein offenes Datenformat nativ verwendet. Das Warehouse basiert auf dem robusten SQL Server-Abfrageoptimierer und einem verteilten Abfrageverarbeitungsmodul auf Unternehmensniveau, das die Notwendigkeit von Konfiguration und Verwaltung beseitigt. Data Warehouse in Microsoft Fabric lässt sich nahtlos in Data Factory für Datenaufnahme, Power BI für Analyse und Berichterstellung sowie Synapse Spark für Data Science und maschinelles Lernen integrieren. Die Analyseinvestitionen einer Organisation werden optimiert, indem Data Lakes und Warehouses zusammenführt werden.

Data Warehousing-Workloads profitieren von den umfangreichen Funktionen der SQL-Engine über ein offenes Datenformat, sodass Kundinnen und Kunden sich auf Analysen und Berichte konzentrieren können. Sie profitieren auch vom Zugriff auf Daten aus OneLake, einem Data Lake Storage-Virtualisierungs-Dienst.

Weitere Informationen finden Sie in der Dokumentation.

Schwerpunkte

Funktion Geschätzter Zeitplan für die Veröffentlichung
Aktualisierungen von Abfrageeinblicken Q4 2024
Copilot für Data Warehouse: Sidecar Chat Q4 2024
BULK INSERT Q1 2025
OPENROWSET Q1 2025
Zwischenspeichern von Resultsets Q1 2025
Verbesserungen der automatischen Statistik Q1 2025
SHOWPLAN_XML Q1 2025
Copilot für SQL-Analyseendpunkt Q1 2025
AKTUALISIEREN der REST-API des SQL Analytics-Endpunkts Q1 2025
Codemigrations-Assistent Q1 2025
Datenclustering Q1 2025
Tabelle ändern - Spalte ablegen/umbenennen Q1 2025
Temporäre Tabellen (Sitzungsbereich) Q1 2025
MERGE (T-SQL) Q1 2025
SQL-Überwachungsprotokolle Q1 2025
EXECUTE AS Q1 2025
BCP Q1 2025
VARCHAR(MAX)/VARBINARY(MAX)-Typen Ausgeliefert (Q4 2024)
Verbesserungen des SQL Analytics-Endpunkts Ausgeliefert (Q4 2024)
JSON-Unterstützung Ausgeliefert (Q4 2024)
Verbesserung der Zeichenfolgeleistung Ausgeliefert (Q4 2024)
Unterstützung der Sortierung ohne Groß-/Kleinschreibung (nur Lager) Ausgeliefert (Q4 2024)
Geschachtelte CTE Ausgeliefert (Q4 2024)
T-SQL-Notebookintegration Verfügbar (Q3 2024)
TRUNCATE Verfügbar (Q3 2024)
ALTER TABLE – Hinzufügen von nullbaren Spalten Verfügbar (Q3 2024)
Aktualisierungen von Abfrageeinblicken Verfügbar (Q3 2024)
Direkte Wiederherstellung im Warehouse-Editor Verfügbar (Q2 2024)
COPY INTO-Unterstützung für sicheres Speichern Verfügbar (Q2 2024)
Copilot Verfügbar (Q2 2024)
Zeitreise Verfügbar (Q2 2024)
Warehouse-Überwachungserfahrung Verfügbar (Q2 2024)

Aktualisierungen von Abfrageeinblicken

Geschätzter Zeitplan für die Veröffentlichung: Q4 2024

Versionstyp: Allgemeine Verfügbarkeit

Abfrageeinblicke stellen nun die Datenmenge dar, die während der Abfrageausführung gescannt wurde, spilt nach Arbeitsspeicher, Datenträger und Remote.

Copilot für Data Warehouse: Sidecar Chat

Geschätzter Zeitplan für die Veröffentlichung: Q4 2024

Versionstyp: Öffentliche Vorschau

Copilot für Data Warehouse ist der ultimative gekoppelte Programmierer und Produktivitätsverstärker für alle Kompetenzstufen-Entwickler – von Datenprofis bis hin zu Analysten. Es wurde entwickelt, um die Lagerentwicklung zu beschleunigen, indem er generative KI nutzt, um die Erstellung, Analyse und Verwaltung von Data Warehouse zu vereinfachen und zu automatisieren.

Dieses Feature führt den Copilot Sidecar-Chatbereich ein. Verwenden Sie den Chatbereich, um Fragen zu Ihrem Lagerhaus über natürliche Sprache zu Copilot zu stellen. Zu den Anwendungsfällen zählen:

  • Natural Language to SQL: Stellen Sie Copilot eine Frage zu Ihren Warehouse-Daten und erhalten Sie eine generierte SQL-Abfrage, die auf Ihr Lagerschema zugeschnitten ist.
  • F&A: Stellen Sie Copilot eine Frage zu Ihrem Lager und erhalten Sie eine dokumentbasierte Antwort und Zeiger auf offizielle Dokumentationen.
  • Brainstorming: Verwenden Sie Copilot, um relevante Trends oder Muster zu brainstormen, um innerhalb Ihrer Daten zu analysieren.

BULK INSERT

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Die BULK INSERT-Anweisung wird zum Aufnehmen von Dateien in Fabric DW (ähnlich wie COPY INTO) verwendet. mit der BULK INERT-Funktion aktivieren wir die Migration von SQL Server zu Fabric DW mit minimalen Codeänderungen. Die Kunden müssten ihren Code und externe Tools neu schreiben, die BULK INSERT verwenden, um zu COPY INTO zu migrieren, als Voraussetzung für die Migration zu Fabric DW. Darüber hinaus unterstützen BULK INSERT einige herkömmliche lokale Optionen, die in COPY INTO nicht verfügbar sind.

OPENROWSET

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Fabric DW ermöglicht es den Benutzern, die OPENROWSET-Funktion zum Lesen von Daten aus den Dateien im See zu verwenden. Ein einfaches Beispiel für die OPENROWSET-Funktion ist:

SELECT * 
FROM OPENROWSET ( BULK ‘<file path>’ ) 
WITH ( <column definition> ) 

Die OPENROWSET-Funktion liest den Inhalt der Datei(en) an der angegebenen Stelle <file path> und gibt den Inhalt der Dateien zurück. Thi-Funktion ermöglicht das einfache Durchsuchen und Anzeigen einer Vorschau der Dateien vor der Aufnahme.

Zwischenspeichern von Resultsets

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Das Zwischenspeichern von Resultset speichert die Ergebnisse anwendbarer Abfragen und gibt sie bei späteren Durchläufen sofort zurück. Dadurch wird die Ausführungszeit drastisch reduziert, da eine erneute Kompilierung und Berechnung entfällt. Der Cache wird automatisch verwaltet und erfordert keinen manuellen Eingriff.

Verbesserungen der automatischen Statistik

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

Verschiedene Verbesserungen sind geplant – kürzere Ausführungszeit für automatische Statistikaktualisierungen, opportunistische Unterstützung für VARCHAR(MAX)-Spaltentypen, verbesserte Speicherung von Zwischenstatistikschritten, automatische Statistikwartung außerhalb der Benutzerabfrage.

SHOWPLAN_XML

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

SHOWPLAN_XML gibt detaillierte Informationen dazu zurück, wie die Anweisungen in Form eines gut definierten XML-Dokuments ausgeführt werden, ohne die T-SQL-Anweisung auszuführen.

Copilot für SQL-Analyseendpunkt

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Copilot für Data Warehouse ist der ultimative gekoppelte Programmierer und Produktivitätsverstärker für alle Kompetenzstufen-Entwickler – von Datenprofis bis hin zu Analysten. Es wurde entwickelt, um die Lagerentwicklung zu beschleunigen, indem er generative KI nutzt, um die Erstellung, Analyse und Verwaltung von Data Warehouse zu vereinfachen und zu automatisieren. Dieses Feature ermöglicht die Copilot-Verwendung im SQL-Analyseendpunkt.

AKTUALISIEREN der REST-API des SQL Analytics-Endpunkts

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

Lösen Sie programmgesteuert eine Aktualisierung Ihres SQL-Analyseendpunkts aus, um Tabellen mit allen Änderungen, die im übergeordneten Element vorgenommen wurden, synchron zu halten.

Codemigrations-Assistent

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Um die Migration von SQL Server, Synapse dedizierten SQL-Pools und anderen Warehouses zum Fabric Data Warehouse zu beschleunigen, können Benutzer den Code und die Daten aus der Quelldatenbank migrieren, das Quellschema und den Code automatisch in Fabric Data Warehouse konvertieren, bei der Datenmigration helfen und KI-unterstützung bereitstellen.

Datenclustering

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Datenclustering ermöglicht eine schnellere Leseleistung, indem Kunden Spalten für die gemeinsame Suche von Daten bei der Erfassung angeben können, um das Überspringen von Dateien beim Lesen zu ermöglichen.

Tabelle ändern - Spalte ablegen/umbenennen

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

Alter Table – Drop/Rename ermöglicht Es Kunden, ihre Tabellendefinition durch Ablegen und Umbenennen von Spalten zu ändern. Dies ist zusätzlich zu vorhandenen Alter Table-Funktionen, die das Hinzufügen neuer Spalten unterstützen und heute in der Produktion sind.

Temporäre Tabellen (Sitzungsbereich)

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

Sitzungsbereichsbezogene, geparkte temporäre Tabellen ermöglichen Es Kunden, Zwischenergebnissätze für wiederholten Zugriff zu speichern, sind jedoch nicht erforderlich, dauerhaft zu speichern. Sie funktionieren als normale Permamenttabelle, verschwinden jedoch, wenn die Verbindung geschlossen wird.

MERGE (T-SQL)

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

Der BEFEHL MERGE T-SQL für Fabric Data Warehouse bringt die Leistungsfähigkeit von auswahlbasierter DML in eine einzelne Anweisung für alle Ihre Transformationslogikanforderungen.

SQL-Überwachungsprotokolle

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

Dieses Feature verfolgt Datenbankereignisse und schreibt sie in ein Überwachungsprotokoll, sodass Kunden die Überwachungsdatei mithilfe von sys.fn_get_audit_file_v2 zur Überwachung und Compliance abfragen können.

EXECUTE AS

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Allgemeine Verfügbarkeit

EXECUTE AS legt den Ausführungskontext für eine Sitzung fest und ermöglicht es dem Benutzer, die Identität eines anderen Benutzers zu überprüfen, die erforderlichen Berechtigungen zu überprüfen, die bereitgestellt wurden.

BCP

Geschätzter Zeitplan für die Veröffentlichung: Q1 2025

Versionstyp: Öffentliche Vorschau

Fabric DW unterstützt bcp-Hilfsprogramm und die TDS-Massenlade-API. Die Massen-Lod-API ermöglicht eine Vielzahl von Clienttools wie bcp, SSIS, ADF, zum Laden von Daten in Fabric DW. Ein Beispiel für bcp-Befehl, der einen Inhalt einer Datei in die DW-Tabelle lädt, lautet:

bcp gold.artists in "C:\temp\gold_artist.txt" -d TextDW -c -S "<server name>.msit-datawarehouse.fabric.microsoft.com" -G -U theusert@microsoft.com 

Verfügbare Features

VARCHAR(MAX)/VARBINARY(MAX)-Typen

Ausgeliefert (Q4 2024)

Versionstyp: Öffentliche Vorschau

Benutzende können Spalten mit VARCHAR(MAX)/VARBINARY(MAX)-Typen in Data Warehouse definieren, um Zeichenfolgen- oder Binärdaten bis zu 1 MB zu speichern. Im SQL-Endpunkt für das Lakehouse werden die Zeichenfolgentypen in Delta-Tabellen ohne Abkürzung auf 8 KB als VARCHAR(MAX) dargestellt. Die Leistungsunterschiede zwischen den Abfragen, die mit VARCHAR(MAX)- und VARCHAR(8000)-Typen arbeiten, werden minimiert, sodass Benutzende große Typen ohne erhebliche Leistungseinbußen verwenden können.

Verbesserungen des SQL Analytics-Endpunkts

Ausgeliefert (Q4 2024)

Versionstyp: Allgemeine Verfügbarkeit

Dieses Feature umfasst Aktualisierungen an der SQL Analytics-Endpunktoberfläche, einschließlich:

  • Automatische Aktualisierung ausgelöst beim Öffnen des Elements oder Herstellen einer Verbindung mit dem Endpunkt
  • Verbesserte Benutzeroberfläche zum Aktualisieren des SQL-Analyseendpunkts direkt im Menüband
  • Neue Eigenschaft für "Letzte erfolgreiche Aktualisierung" in OneLake über das Flyout "Tabelleneigenschaften"
  • Verbesserte Fehlermeldungen

JSON-Unterstützung

Ausgeliefert (Q4 2024)

Versionstyp: Allgemeine Verfügbarkeit

Die JSON-Unterstützung in Fabric Datawarehouse ermöglicht die Verarbeitung von textbezogenen Daten, die als JSON-Text formatiert sind. Die neuen JSON-Features in Fabric DW sind:

  • FOR JSON-Abfrageoption, die die Abfrageergebnisse als JSON-Text formatiert. Dies war eine der Features, die auf der Microsoft Fabric Idea-Website angefordert werden.
  • JSON-Skalarfunktionen, die auch in der Azure SQL-Datenbank verwendet werden können. Zusätzlich zu den vorhandenen JSON-Skalarfunktionen (ISJSON, JSON_VALUE, JSON_QUERY und JSON_MODIFY) setzt Fabric DW die neuesten JSON-Funktionen, die in Azure SQL-Datenbank vorhanden sind – JSON_PATH_EXISTS, JSON_OBJECT und JSON_ARRAY.

Verbesserung der Zeichenfolgeleistung

Ausgeliefert (Q4 2024)

Versionstyp: Allgemeine Verfügbarkeit

Vorgänge für Zeichenfolgen (VARCHAR(N)) sind in T-SQL-Abfragen üblich. Leistungsverbesserungen bei Zeichenfolgenfunktionen und Operatoren, die mit Zeichenfolgen arbeiten, erhöhen die Leistung der Abfragen, die LIKE-Prädikate, Zeichenfolgenfunktionen und Vergleichsoperatoren in WHERE-Prädikaten und Operatoren wie GROUP BY, ORDER BY, JOIN verwenden, die mit Zeichenfolgentypen arbeiten.

Unterstützung der Sortierung ohne Groß-/Kleinschreibung (nur Lager)

Ausgeliefert (Q4 2024)

Versionstyp: Allgemeine Verfügbarkeit

Die Verwendung der öffentlichen REST-APIs zum Erstellen eines Data Warehouse umfasst eine neue Option zum Festlegen der Standardsortierung.  Dies kann verwendet werden, um einen neuen Standardwert für die Sortierung ohne Groß-/Kleinschreibung festzulegen. Die beiden unterstützten Sortierungen sind Latin1_General_100_CI_AS_KS_WS_SC_UTF8 (Groß-/Kleinschreibung wird nicht beachtet) und Latin1_General_100_BIN2_UTF8 (Groß-/Kleinschreibung wird beachtet) und ist weiterhin unsere Standardeinstellung.

Die UNTERSTÜTZUNG von COLLATE T-SQL-Klauseln wird in Kürze verfügbar sein. Auf diese Weise können Sie den BEFEHL COLLATE mit CREATE oder ALTER TABLE verwenden, um die Sortierung für Ihre VARCHAR-Felder direkt anzugeben.

Geschachtelte CTE

Ausgeliefert (Q4 2024)

Common Table Expressions (CTE) erhöht die Lesbarkeit und Vereinfachung für komplexe Abfragen, indem komplexe Abfragen in einfache Blöcke decodiert und bei Bedarf wiederverwendet werden, anstatt die Abfrage neu zu schreiben.   Eine geschachtelte CTE wird mit der Definition eines anderen CTE definiert.

T-SQL-Notebookintegration

Verfügbar (Q3 2024)

Versionstyp: Öffentliche Vorschau

Sie können mit der Verwendung der T-SQL-Sprachunterstützung in Notebooks beginnen, die die Leistungsfähigkeit von Notebooks und SQL innerhalb derselben Oberfläche kombiniert – die Aktivierung von IntelliSense, autoVervollständigen, datenbankübergreifende Abfragen, umfangreichere Visualisierungen und die Möglichkeit, mithilfe von Notebooks problemlos im Team zusammenzuarbeiten und sie gemeinsam zu nutzen.

TRUNCATE

Verfügbar (Q3 2024)

Mit dem Befehl „TRUNCATE“ werden schnell alle Datenzeilen aus einer Tabelle entfernt.

ALTER TABLE – Hinzufügen von nullbaren Spalten

Verfügbar (Q3 2024)

Unterstützung für ALTER TABLE ADD COLUMN, um bereits vorhandene Tabellen mit neuen Spalten zu erweitern, die NULL-Werte zulassen.

Aktualisierungen von Abfrageeinblicken

Verfügbar (Q3 2024)

Eine historische Ansicht Ihrer geschlossenen Sitzungen wird über Abfrageeinblicke zur Verfügung gestellt. Dadurch können Sie Datenverkehr, Last und Nutzung Ihrer DW analysieren.

Direkte Wiederherstellung im Warehouse-Editor

Verfügbar (Q2 2024)

Sie können jetzt problemlos Wiederherstellungspunkte erstellen und das Warehouse im Falle einer versehentlichen Beschädigung in einem bekannten guten Zustand wiederherstellen, indem Sie die Benutzeroberfläche des Warehouse-Editors verwenden.

COPY INTO-Unterstützung für sicheres Speichern

Verfügbar (Q2 2024)

Versionstyp: Öffentliche Vorschau

Sie können jetzt Daten in Ihr Warehouse aufnehmen, indem Sie COPY INTO aus einem externen Azure-Speicherkonto verwenden, das hinter einer Firewall geschützt ist.

Copilot

Verfügbar (Q2 2024)

Versionstyp: Öffentliche Vorschau

Copilot ermöglicht Entwickelnden jedes Qualifikationsniveaus, schnell ein Warehouse in Fabric zu erstellen und abzufragen. Copilot bietet Beratung und bewährte Methoden, AutoVervollständigen-Code, Hilfe beim Beheben und Dokumentieren von Code und bietet Unterstützung bei der Datenvorbereitung, Modellierung und Analyse.

Zeitreise

Verfügbar (Q2 2024)

Die Möglichkeit der Zeitreise auf T-SQL-Anweisungsebene ermöglicht es Benutzenden, historische Daten aus verschiedenen vergangenen Zeiträumen abzufragen, indem sie den Zeitstempel nur einmal für die gesamte Abfrage angeben. Durch die Verwendung einer einzigen Kopie der in One Lake vorhandenen Daten für die Durchführung historischer Trendanalysen, die Fehlerbehebung und den Datenabstimmung lassen sich durch Zeitreisen erhebliche Speicherkosten sparen. Darüber hinaus erleichtert es die Erstellung stabiler Berichte, indem es die Datenintegrität über verschiedene Tabellen innerhalb des Data Warehouse aufrechterhält.

Warehouse-Überwachungserfahrung

Verfügbar (Q2 2024)

Mit der integrierten Warehouse-Überwachung können Sie sowohl Live-Abfragen als auch historische Abfragen anzeigen, die Leistung ihrer End-to-End-Lösung überwachen und Fehler beheben.