Schützen und Überwachen Ihres Data Warehouse

Abgeschlossen

Sicherheit und Überwachung sind wichtige Aspekte bei der Verwaltung Ihres Data Warehouse.

Sicherheit

Die Sicherheit des Data Warehouse ist wichtig, um Ihre Daten vor nicht autorisierten Zugriffen zu schützen. Fabric bietet mehrere Sicherheitsfeatures, mit denen Sie Ihr Data Warehouse schützen können. Dazu zählen unter anderem folgende Einstellungen:

  • Die rollenbasierte Zugriffssteuerung (Role-Based Access Control, RBAC) wird zum Steuern des Zugriffs auf das Warehouse und seine Daten verwendet.
  • Mit der SSL-Verschlüsselung wird die Kommunikation zwischen dem Warehouse und den Clientanwendungen geschützt.
  • Die Azure-Speicherdienstverschlüsselung dient dem Schutz von Daten während der Übertragung und von ruhenden Daten.
  • Azure Monitor und Azure Log Analytics werden genutzt, um die Warehouseaktivität und den Zugriff auf die Daten zu überwachen.
  • Mit der Multi-Faktor-Authentifizierung (MFA) wird Benutzerkonten eine zusätzliche Sicherheitsebene hinzugefügt.
  • Microsoft Entra ID-Integration zum Verwalten von Benutzeridentitäten und des Zugriffs auf das Warehouse.

Arbeitsbereichberechtigungen

Daten in Fabric werden in Arbeitsbereichen organisiert, die zum Steuern des Zugriffs und zur Verwaltung des Lebenszyklus von Daten und Diensten verwendet werden. Geeignete Arbeitsbereichsrollen sind die erste Verteidigungsebene für den Schutz Ihres Data Warehouse.

Zusätzlich zu Arbeitsbereichsrollen können Sie Elementberechtigungen und Zugriff über SQL gewähren.

Tipp

Weitere Informationen zu Arbeitsbereichsrollen finden Sie unter Arbeitsbereiche in Power BI.

Elementberechtigungen

Im Gegensatz zu Arbeitsbereichsrollen, die für alle Elemente innerhalb eines Arbeitsbereichs gelten, können Sie Elementberechtigungen verwenden, um Zugriff auf einzelne Warehouses zu gewähren. Dadurch können Sie ein einzelnes Data Warehouse für die nachgelagerte Nutzung freigeben.

Sie können Benutzer*innen Berechtigungen über T-SQL oder im Fabric-Portal erteilen. Erteilen Sie Benutzer*innen, die auf Ihr Data Warehouse zugreifen müssen, die folgenden Berechtigungen:

  • Read: Ermöglicht dem*der Benutzer*in, mithilfe der SQL-Verbindungszeichenfolge eine Verbindung herzustellen.
  • ReadData: Ermöglicht dem*der Benutzer*in das Lesen von Daten aus einer beliebigen Tabelle bzw. Ansicht innerhalb des Warehouse.
  • ReadAll: Ermöglicht dem*der Benutzer*in das Lesen von Daten in den rohen Parquet-Dateien in OneLake, die von Spark verwendet werden können.

Eine Benutzerverbindung zum SQL-Analyseendpunkt schlägt fehl, wenn nicht mindestens eine Leseberechtigung vorliegt.

Überwachung

Die Überwachung von Aktivitäten in Ihrem Data Warehouse ist von entscheidender Bedeutung, um eine optimale Leistung, effiziente Ressourcennutzung und Sicherheit zu gewährleisten. Sie hilft Ihnen, Probleme zu identifizieren, Anomalien zu erkennen und Maßnahmen zu ergreifen, um den reibungslosen und sicheren Betrieb des Data Warehouse zu gewährleisten.

Sie können dynamische Verwaltungsansichten (Dynamic Management Views, DMVs) verwenden, um Verbindungen und Sitzungen zu überwachen und den Status abzufragen und so Live-Erkenntnisse zum SQL-Abfragelebenszyklus anzuzeigen. Mit DMVs können Sie Details wie die Anzahl der aktiven Abfragen abrufen und ermitteln, welche Abfragen über einen längeren Zeitraum ausgeführt werden und beendet werden müssen.

Derzeit stehen drei DMVs für die Verwendung in Fabric zur Verfügung:

  • sys.dm_exec_connections: Gibt Informationen zu jeder Verbindung zurück, die zwischen dem Warehouse und der Engine hergestellt wurde.
  • sys.dm_exec_sessions: Gibt Informationen zu jeder Sitzung zurück, die zwischen dem Element und der Engine authentifiziert wurde.
  • sys.dm_exec_requests: Gibt Informationen zu jeder aktiven Anforderung in einer Sitzung zurück.

Abfrageüberwachung

Verwenden Sie „sys.dm_exec_requests“, um Abfragen mit langer Ausführungsdauer zu identifizieren, die sich möglicherweise auf die Gesamtleistung der Datenbank auswirken, und ergreifen Sie geeignete Maßnahmen, um diese Abfragen zu optimieren oder zu beenden.

Identifizieren Sie zunächst die Abfragen, die seit langem ausgeführt werden. Verwenden Sie die folgende Abfrage, um zu ermitteln, welche Abfragen am längsten ausgeführt wurden (in absteigender Reihenfolge):

    SELECT request_id, session_id, start_time, total_elapsed_time
    FROM sys.dm_exec_requests
    WHERE status = 'running'
    ORDER BY total_elapsed_time DESC;

Sie können weiter untersuchen, um zu ermitteln, welche*r Benutzer*in die Sitzung mit der Abfrage mit langer Ausführungszeit ausgeführt hat, indem Sie Folgendes ausführen:

    SELECT login_name
    FROM sys.dm_exec_sessions
    WHERE 'session_id' = 'SESSION_ID WITH LONG-RUNNING QUERY';

Schließlich können Sie den KILL-Befehl verwenden, um die Sitzung mit der Abfrage mit langer Ausführungszeit zu beenden:

    KILL 'SESSION_ID WITH LONG-RUNNING QUERY';

Wichtig

Sie müssen ein*e Arbeitsbereichsadministrator*in sein, um den KILL-Befehl ausführen zu können. Arbeitsbereichsadministrator*innen können alle drei DMVs ausführen. Die Rollen „Mitglied“, „Mitwirkender“ und „Zuschauer“ können ihre eigenen Ergebnisse innerhalb des Warehouse sehen, aber die Ergebnisse anderer Benutzer*innen werden nicht angezeigt.