Konfigurera läge för hög samtidighet för Notebook-filer i Infrastruktur
När du kör en notebook-fil i Microsoft Fabric startas en Apache Spark-session och används för att köra de frågor som skickas som en del av körningen av notebook-cellen. När läget Hög samtidighet är aktiverat behöver du inte starta nya Spark-sessioner varje gång för att köra en notebook-fil.
Om du redan har en session med hög samtidighet igång kan du koppla notebook-filer till sessionen med hög samtidighet och få en Spark-session direkt för att köra frågorna och uppnå en högre sessionsanvändning.
Kommentar
Den lägesbaserade sessionsdelningen med hög samtidighet ligger alltid inom en enda användargräns. Notebook-filerna måste ha matchande Spark-konfigurationer, ska vara en del av samma arbetsyta, dela samma standard lakehouse och bibliotek för att dela en enda Spark-session.
Villkor för sessionsdelning
För att notebook-filer ska kunna dela en enda Spark-session måste de:
- Körs av samma användare.
- Ha samma standard lakehouse. Notebook-filer utan standard lakehouse kan dela sessioner med andra notebook-filer som inte har ett standard lakehouse.
- Ha samma Spark-beräkningskonfigurationer.
- Ha samma bibliotekspaket. Du kan ha olika installationer av infogade bibliotek som en del av notebook-celler och fortfarande dela sessionen med notebook-filer som har olika biblioteksberoenden.
Konfigurera läge för hög samtidighet
Som standard är alla infrastrukturarbetsytor aktiverade med hög samtidighetsläge. Använd följande steg för att konfigurera funktionen med hög samtidighet:
Klicka på Alternativet Inställningar för arbetsyta i din infrastrukturarbetsyta
Navigera till Dataingenjör ing/Science-avsnittet > Spark-inställningar>Hög samtidighet
I avsnittet Hög samtidighet och aktivera den för notebook-filer. Du kan välja att aktivera eller inaktivera inställningen från det här fönstret.
Om du aktiverar alternativet hög samtidighet kan användarna starta en session med hög samtidighet i sina notebook-filer eller ansluta till en befintlig session med hög samtidighet.
Om du inaktiverar läget för hög samtidighet döljs avsnittet för att konfigurera tidsperioden för inaktivitet och döljer även alternativet att starta en ny session med hög samtidighet från notebook-menyn.
Köra notebook-filer i session med hög samtidighet
Öppna arbetsytan Infrastruktur
Skapa en notebook-fil eller öppna en befintlig notebook-fil
Gå till fliken Kör i menyfliksområdet och välj i listrutan sessionstyp där Standard har valts som standardalternativ.
Välj Ny session med hög samtidighet.
När sessionen med hög samtidighet har startat kan du nu lägga till upp till 5 notebook-filer i sessionen med hög samtidighet.
Skapa en ny notebook-fil och gå till menyn Kör enligt ovanstående steg. I den nedrullningsbara menyn ser du nu den nyligen skapade sessionen med hög samtidighet i listan.
Om du väljer den befintliga sessionen med hög samtidighet kopplas den andra anteckningsboken till sessionen.
När notebook-filen har anslutits kan du börja köra notebook-stegen direkt.
Sessionsstatusen för hög samtidighet visar också antalet notebook-filer som är kopplade till en viss session när som helst.
När som helst om du känner att anteckningsboken som är kopplad till en session med hög samtidighet kräver mer dedikerad beräkning kan du välja att växla anteckningsboken till en standardsession genom att välja alternativet att koppla från anteckningsboken från fliken Hög samtidighet på fliken Kör-menyn.
Du kan visa sessionsstatus, typ och sessions-ID genom att gå till statusfältet , välja sessions-ID:t så att du kan utforska jobben som körs i den här sessionen med hög samtidighet och visa loggar för Spark-sessionen på sidan med övervakningsinformation.
Övervaka och felsöka notebook-filer som körs i session med hög samtidighet
Övervakning och felsökning är ofta en icke-trivial uppgift när du kör flera notebook-filer i en delad session. För läge för hög samtidighet i Infrastrukturresurser erbjuds separation av loggar som gör det möjligt för användare att spåra loggarna som genereras av spark-händelser från olika notebook-filer.
När sessionen pågår eller är i slutfört tillstånd kan du visa sessionsstatusen genom att gå till menyn Kör och välja alternativet Alla körningar
Detta skulle öppna körningshistoriken för notebook-filen som visar listan över aktuella aktiva och historiska spark-sessioner
Användare genom att välja en session kan komma åt övervakningsinformationsvyn, som visar listan över alla spark-jobb som har körts i sessionen.
Vid session med hög samtidighet kan användarna identifiera jobben och dess associerade loggar från olika notebook-filer med hjälp av fliken Relaterad anteckningsbok , som visar anteckningsboken som jobbet har körts från.
Relaterat innehåll
I det här dokumentet får du en grundläggande förståelse för en sessionsdelning via hög samtidighetsläge i notebook-filer. Gå vidare till nästa artiklar för att lära dig hur du skapar och kommer igång med dina egna Dataingenjör upplevelser med Lakehouse och Notebooks:
- Information om hur du kommer igång med Lakehouse finns i Skapa ett Lakehouse.
- Information om hur du kommer igång med notebook-filer finns i Så här använder du en notebook-fil