Freigeben über


Konfigurieren des Modus für hohe Parallelität für Fabric-Notebooks

Wenn Sie ein Notebook in Microsoft Fabric ausführen, wird eine Apache Spark-Sitzung gestartet und zur Ausführung der Abfragen verwendet, die im Rahmen der Ausführung von Notebookzellen übermittelt werden. Wenn der Modus für hohe Parallelität aktiviert ist, müssen Sie nicht jedes Mal eine neue Spark-Sitzung starten, um ein Notebook auszuführen.

Wenn bereits eine Sitzung mit hoher Parallelität ausgeführt wird, können Sie Notebooks an die vorhandene Sitzung mit hoher Parallelität anfügen. Auf diese Weise erhalten Sie sofort eine Spark-Sitzung, um Abfragen auszuführen und eine höhere Sitzungsauslastung zu erzielen.

Animation, die eine Sitzung mit hoher Parallelität für Notebooks zeigt.

Hinweis

Die auf dem Modus für hohe Parallelität basierende Sitzungsfreigabe erfolgt immer innerhalb einer einzelnen Benutzergrenze. Die Notebooks müssen identische Spark-Konfigurationen aufweisen, sollten demselben Arbeitsbereich angehören, dasselbe standardmäßige Lakehouse und dieselben Standardbibliotheken verwenden, um eine einzelne Spark-Sitzung gemeinsam zu nutzen.

Bedingungen für die Sitzungsfreigabe

Damit Notebooks eine einzelne Spark-Sitzung freigeben können, müssen sie:

  • Vom/von der selben Benutzer*in ausgeführt werden.
  • Über das gleiche Standardlakehouse verfügen. Notebooks ohne Standardlakehouse können Sitzungen mit anderen Notebooks teilen, die nicht über ein Standardlakehouse verfügen.
  • Dieselben Spark-Computekonfigurationen aufweisen.
  • Dieselben Bibliothekspakete auf aufweisen. Du kannst unterschiedliche Inlinebibliotheksinstallationen als Teil von Notebookzellen verwenden und die Sitzung weiterhin mit Notebooks teilen, die unterschiedliche Bibliotheksabhängigkeiten aufweisen.

Konfigurieren des Modus für hohe Parallelität

Standardmäßig werden alle Fabric-Arbeitsbereiche mit dem Modus für hohe Parallelität aktiviert. Führen Sie die folgenden Schritte aus, um das Feature für hohe Parallelität zu konfigurieren:

  1. Klicken Sie in Ihrem Fabric-Arbeitsbereich auf die Option Arbeitsbereichseinstellungen.

    Screenshot, der die Navigation zu den Arbeitsbereichseinstellungen zeigt.

  2. Navigieren Sie zum Abschnitt Datentechnik/Data Science >Spark-Einstellungen>Hohe Parallelität

  3. Aktivieren Sie die Option im Abschnitt Hohe Parallelität für Notebooks. Sie können die Einstellung in diesem Bereich aktivieren oder deaktivieren.

    Screenshot, der den Abschnitt „Hohe Parallelität“ in den Arbeitsbereichseinstellungen zeigt.

  4. Wenn Sie die Option für hohe Parallelität aktivieren, können Benutzer*innen eine Sitzung mit hoher Parallelität auf ihren Notebooks starten oder das Notebook an eine vorhandene Sitzung mit hoher Parallelität anfügen.

  5. Wenn Sie den Modus für hohe Parallelität deaktivieren, wird der Abschnitt zum Konfigurieren des Zeitraums der Inaktivität ausgeblendet, und die Option zum Starten einer neuen Sitzung mit hoher Parallelität wird ebenfalls nicht mehr im Notebookmenü angezeigt.

    Screenshot, der die deaktivierte Option „Hohe Parallelität“ in den Arbeitsbereichseinstellungen zeigt.

Ausführen von Notebooks in einer Sitzung mit hoher Parallelität

  1. Öffnen des Fabric-Arbeitsbereichs

  2. Erstellen eines Notebooks oder Öffnen eines vorhandenen Notebooks

  3. Navigieren Sie im Menüband zur Registerkarte Ausführen, und wählen Sie das Dropdownmenü Sitzungstyp aus, in dem per Voreinstellung die Option Standard ausgewählt ist.

    Screenshot, der die Option „Hohe Parallelität“ im Notebookmenü zeigt.

  4. Wählen Sie Neue Sitzung mit hoher Parallelität aus.

  5. Nachdem die Sitzung mit hoher Parallelität gestartet wurde, können Sie der Sitzung mit hoher Parallelität nun bis zu 5 Notebooks hinzufügen.

    Screenshot, der die Option zum Starten einer neuen Sitzung mit hoher Parallelität im Notebookmenü zeigt.

  6. Erstellen Sie ein neues Notebook, und navigieren Sie zum Menü Ausführen wie in den oben beschriebenen Schritten. Im Dropdownmenü wird jetzt die neu erstellte Sitzung mit hoher Parallelität angezeigt.

  7. Wenn Sie die vorhandene Sitzung mit hoher Parallelität auswählen, wird das zweite Notebook an die Sitzung angefügt.

    Screenshot, der die Option zum Anfügen an eine vorhandene Sitzung mit hoher Parallelität im Notebookmenü zeigt.

  8. Nachdem das Notebook angefügt wurde, können Sie sofort mit der Ausführung der Notebookschritte beginnen.

  9. Der Sitzungsstatus mit hoher Parallelität zeigt auch die Anzahl der Notebooks an, die zum jeweiligen Zeitpunkt an eine bestimmte Sitzung angefügt sind.

  10. Wenn Sie der Meinung sind, dass das an eine Sitzung mit hoher Parallelität angefügte Notebook mehr dedizierte Computeressourcen benötigt, können Sie jederzeit zu einer Standardsitzung wechseln, indem Sie auf der Registerkarte „Ausführen“ die Option zum Trennen des Notebooks von der Sitzung mit hoher Parallelität auswählen.

    Screenshot, der die Option zum Trennen einer Sitzung mit hoher Parallelität im Notebookmenü zeigt.

  11. Sie können den Sitzungsstatus, den Sitzungstyp und die Sitzungs-ID anzeigen, indem Sie zur Statusleiste navigieren. Wählen Sie die Sitzungs-ID aus, um die in dieser Sitzung mit hoher Parallelität ausgeführten Aufträge zu untersuchen und die Protokolle der Spark-Sitzung auf der Seite mit den Überwachungsdetails anzuzeigen.

    Screenshot, der die Details zu einer Sitzung mit hoher Parallelität im Notebookmenü zeigt.

Überwachen und Debuggen von Notebooks, die in einer Sitzung mit hoher Parallelität ausgeführt werden

Überwachung und Debugging sind oftmals nicht einfach, wenn Sie mehrere Notebooks in einer freigegebenen Sitzung ausführen. Für den Modus für hohe Parallelität in Fabric wird eine Trennung der Protokolle angeboten, die es den Benutzer*innen ermöglicht, die durch Spark-Ereignisse ausgegebenen Protokolle verschiedener Notebooks nachzuverfolgen.

  1. Bei laufenden oder abgeschlossenen Sitzungen können Sie den Sitzungsstatus anzeigen, indem Sie zum Menü Ausführen navigieren und die Option Alle Ausführungen auswählen.

  2. Dadurch wird der Ausführungsverlauf des Notebooks mit einer Liste der aktuell aktiven und historischen Spark-Sitzungen geöffnet.

    Screenshot, der die Seite „Alle Ausführungen“ für ein Notebook in einer Sitzung mit hoher Parallelität zeigt.

  3. Benutzer*innen können durch Auswahl einer Sitzung zur Ansicht mit den Überwachungsdetails wechseln, die eine Liste aller Spark-Aufträge anzeigt, die in der Sitzung ausgeführt wurden.

  4. Im Falle einer Sitzung mit hoher Parallelität können Benutzer*innen die Aufträge und die zugehörigen Protokolle aus verschiedenen Notebooks über die Registerkarte Zugehörige Notebooks identifizieren, die das Notebook anzeigt, von dem aus der Auftrag ausgeführt wurde.

    Screenshot, der alle zugehörigen Notebooks für eine Sitzung mit hoher Parallelität in der Ansicht mit den Überwachungsdetails zeigt.

In diesem Dokument haben Sie die Grundlagen der Freigabe von Sitzungen durch den Modus für hohe Parallelität in Notebooks kennengelernt. Fahren Sie mit den nächsten Artikeln fort, um zu erfahren, wie Sie mit Lakehouse und Notebooks Ihre eigenen Datentechnikumgebungen erstellen und erste Schritte unternehmen können: