Delen via


Gegevens transformeren door een Spark-taakdefinitieactiviteit uit te voeren

Met de activiteit Spark-taakdefinitie in Data Factory voor Microsoft Fabric kunt u verbindingen maken met uw Spark-taakdefinities en deze uitvoeren vanuit een gegevenspijplijn.

Voorwaarden

Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:

Een Spark-taakdefinitieactiviteit toevoegen aan een pijplijn met de gebruikersinterface

  1. Maak een nieuwe gegevenspijplijn in uw werkruimte.

  2. Zoek op de beginschermkaart naar Spark-taakdefinitie en selecteer deze of selecteer de activiteit in de balk Activiteiten om deze toe te voegen aan het pijplijncanvas.

    • De activiteit maken vanaf de kaart op het startscherm:

      schermopname die laat zien waar een nieuwe Spark-taakdefinitieactiviteit moet worden gemaakt.

    • De activiteit maken vanuit de activiteitenbalk:

      schermopname die laat zien waar u een nieuwe Spark-taakdefinitieactiviteit maakt vanuit de activiteitenbalk in het venster van de pijplijneditor.

  3. Selecteer de nieuwe Spark-taakdefinitieactiviteit op het canvas van de pijplijneditor als deze nog niet is geselecteerd.

    Screenshot van de activiteit Spark Job Definition op het canvas van de pijplijneditor.

    Raadpleeg de Algemene instellingen richtlijnen voor het configureren van de opties op het tabblad Algemene instellingen.

Activiteitsinstellingen voor Spark-taakdefinitie

Selecteer het tabblad Instellingen in het deelvenster Activiteitseigenschappen en selecteer vervolgens de Infrastructuurwerkruimte die de Spark-taakdefinitie bevat die u wilt uitvoeren.

Schermopname van het tabblad Instellingen van de eigenschappenpagina's van de Spark-taakdefinitie in het venster van de pijplijneditor.

Bekende beperkingen

De huidige beperkingen in de Spark-taakdefinitieactiviteit voor Fabric Data Factory worden hier vermeld. Deze sectie kan worden gewijzigd.

  • Er wordt momenteel geen ondersteuning geboden voor het maken van een nieuwe Spark-taakdefinitieactiviteit binnen de activiteit (onder Instellingen)
  • Ondersteuning voor parameterisatie is niet beschikbaar.
  • Hoewel we ondersteuning bieden voor het bewaken van de activiteit via het uitvoertabblad, kunt u de Spark-taakdefinitie nog niet op een gedetailleerder niveau bewaken. Koppelingen naar de bewakingspagina, status, duur en eerdere Spark-taakdefinitieuitvoeringen zijn bijvoorbeeld niet rechtstreeks beschikbaar in de Data Factory. U kunt echter meer gedetailleerde details zien op de bewakingspagina voor Spark-taakdefinities.

De pijplijn opslaan en uitvoeren of plannen

Nadat u andere activiteiten hebt geconfigureerd die vereist zijn voor uw pijplijn, gaat u naar het tabblad Start boven aan de pijplijneditor en selecteert u de knop Opslaan om uw pijplijn op te slaan. Selecteer uitvoeren om deze rechtstreeks uit te voeren of plannen om het te plannen. U kunt hier ook de uitvoeringsgeschiedenis bekijken of andere instellingen configureren.

Schermopname met het tabblad Start van de pijplijneditor, waarbij de knoppen Opslaan, Uitvoeren en Planning worden gemarkeerd.

Pijplijnuitvoeringen controleren