Delen via


Toegang tot taken in Apache Spark voor Microsoft Fabric

Van toepassing op:✅ Data-engineer ing en Datawetenschap in Microsoft Fabric

Apache Spark for Fabric maakt gebruik van de optimistische taak toegangstechniek om de minimale kernvereiste voor Spark-taken te bepalen. Dit proces is van toepassing op interactieve of batchtaken van notebooks, lakehouses of Spark-taakdefinities. Het is afhankelijk van de minimale knooppuntinstelling van de gekozen Spark-pool in de werkruimte-instellingen of gekoppelde omgeving. Als er beschikbare kernen worden gevonden in de Infrastructuurcapaciteit die is gekoppeld aan de werkruimte, wordt de taak geaccepteerd en wordt de uitvoering gestart. Taken worden gestart met hun minimale knooppuntinstelling en kunnen omhoog worden geschaald binnen hun maximale knooppuntlimieten volgens taakfasen. Als de totale kernen die worden gebruikt door het uitvoeren van taken die gebruikmaken van de Infrastructuurcapaciteit onder de maximale burst-kernen valt die zijn toegewezen, kan de taak omhoog worden geschaald door de taak toegangs- en beperkingslaag in Fabric Spark.

Zie Gelijktijdigheidslimieten en wachtrijen in Microsoft Fabric Spark voor meer informatie.

Hoe werkt optimistische toegang tot taken?

In Fabric worden starterspools geleverd met een standaard minimum van één knooppunt, terwijl u met aangepaste pools minimale knooppunten kunt instellen op basis van workloadbehoeften. Met automatisch schalen worden de rekenvereisten voor Spark-taken aangepast tijdens de uitvoeringsfasen, binnen de geconfigureerde minimum- en maximumknooppunten. Optimistische taaktoekenning evalueert taakinzendingen op basis van beschikbare kernen en voert deze uit met minimale kernen. Taken proberen te groeien op basis van maximaal toegewezen knooppunten tijdens de uitvoering. Aanvragen voor omhoog schalen worden goedgekeurd als het totale aantal Gebruikte Spark-kernen binnen de toegewezen capaciteitslimieten valt.

Notitie

Als het gebruik de maximumlimiet bereikt en alle kernen binnen de totale capaciteit voor Fabric in gebruik zijn, worden eventuele opschaalaanvragen geweigerd. Actieve taken moeten worden voltooid of geannuleerd om kerngeheugens vrij te maken.

Hoe is dit van invloed op gelijktijdigheid van taken?

De minimale kernvereiste voor elke taak bepaalt of de taak kan worden geaccepteerd. Als de capaciteit volledig wordt gebruikt en geen kernen meer heeft om te voldoen aan de minimale kernbehoeften van een taak, wordt de taak geweigerd. Interactieve notebooktaken of Lakehouse-bewerkingen worden geblokkeerd met een foutbericht dat deze aanvraag niet kan worden ingediend omdat alle beschikbare capaciteit momenteel wordt gebruikt. Annuleer een actieve taak, verhoog de beschikbare capaciteit of probeer het later opnieuw. Batchtaken worden in de wachtrij geplaatst en uitgevoerd zodra kernen beschikbaar zijn.

Denk bijvoorbeeld aan een scenario met een gebruiker die gebruikmaakt van de infrastructuur-F32-capaciteits-SKU. Ervan uitgaande dat alle taken gebruikmaken van de standaardinstallatie van een starterspool zonder optimistische toegang tot taken, biedt de capaciteit ondersteuning voor een maximale gelijktijdigheid van drie taken. Het maximum aantal kernen per taak wordt toegewezen volgens de configuratie van de maximale knooppunten.

Schermopname van de gelijktijdigheid van de taak zonder optimistische taakopname in Fabric Spark.

Met optimistische taakopname met dezelfde capaciteit als hierboven kunnen 24 taken worden toegelaten en uitgevoerd met behulp van hun minimale knooppuntconfiguratie tijdens het scenario voor maximale gelijktijdigheid. Omdat voor elke taak 8 Spark-VCores zijn vereist, waarbij één minimale knooppuntconfiguratie gemiddeld is.

Schermopname van de gelijktijdigheid van de taak met optimistische taakopname in Fabric Spark.

Taken schalen met automatische schaalaanpassing van Spark

Wanneer u automatische schaalaanpassing inschakelt voor Spark-pools, worden taken uitgevoerd met hun minimale knooppuntconfiguratie. Tijdens runtime kan het schalen plaatsvinden. Deze aanvragen doorlopen het toegangsbeheer voor taken. Goedgekeurde aanvragen worden omhoog geschaald tot de maximumlimieten op basis van het totale aantal beschikbare kernen. Geweigerde aanvragen hebben geen invloed op actieve taken; ze blijven worden uitgevoerd met hun huidige configuratie totdat kernen beschikbaar zijn.

Schermopname van het omhoog schalen van een taak met optimistische taakopname in Fabric Spark.

Notitie

Als u de maximale kerntoewijzing voor een taak wilt garanderen volgens de configuratie van de maximale knooppunten, schakelt u automatische schaalaanpassing uit en stelt u de maximale knooppunten in de SKU van de infrastructuurcapaciteit in. Omdat de taak geen minimale kernvereiste heeft, wordt deze uitgevoerd zodra er gratis kerngeheugens beschikbaar zijn, waarbij u omhoog kunt schalen naar het geconfigureerde totaal. Als de capaciteit volledig wordt gebruikt, kunnen interactieve notebooktaken worden vertraagd of in de wachtrij geplaatst. Taken in de wachtrij worden automatisch opnieuw geprobeerd zodra er kernen beschikbaar komen.