Gegevens transformeren door een Spark-taakdefinitieactiviteit uit te voeren
Met de activiteit Spark-taakdefinitie in Data Factory voor Microsoft Fabric kunt u verbindingen maken met uw Spark-taakdefinities en deze uitvoeren vanuit een gegevenspijplijn.
Voorwaarden
Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:
- Een tenantaccount met een actief abonnement. Maak gratis een account.
- Er wordt een werkruimte gemaakt.
Een Spark-taakdefinitieactiviteit toevoegen aan een pijplijn met de gebruikersinterface
Maak een nieuwe gegevenspijplijn in uw werkruimte.
Zoek op de beginschermkaart naar Spark-taakdefinitie en selecteer deze of selecteer de activiteit in de balk Activiteiten om deze toe te voegen aan het pijplijncanvas.
Selecteer de nieuwe Spark-taakdefinitieactiviteit op het canvas van de pijplijneditor als deze nog niet is geselecteerd.
Raadpleeg de Algemene instellingen richtlijnen voor het configureren van de opties op het tabblad Algemene instellingen.
Activiteitsinstellingen voor Spark-taakdefinitie
Selecteer het tabblad Instellingen in het deelvenster Activiteitseigenschappen en selecteer vervolgens de Infrastructuurwerkruimte die de Spark-taakdefinitie bevat die u wilt uitvoeren.
Bekende beperkingen
De huidige beperkingen in de Spark-taakdefinitieactiviteit voor Fabric Data Factory worden hier vermeld. Deze sectie kan worden gewijzigd.
- Er wordt momenteel geen ondersteuning geboden voor het maken van een nieuwe Spark-taakdefinitieactiviteit binnen de activiteit (onder Instellingen)
- Ondersteuning voor parameterisatie is niet beschikbaar.
- Hoewel we ondersteuning bieden voor het bewaken van de activiteit via het uitvoertabblad, kunt u de Spark-taakdefinitie nog niet op een gedetailleerder niveau bewaken. Koppelingen naar de bewakingspagina, status, duur en eerdere Spark-taakdefinitieuitvoeringen zijn bijvoorbeeld niet rechtstreeks beschikbaar in de Data Factory. U kunt echter meer gedetailleerde details zien op de bewakingspagina voor Spark-taakdefinities.
De pijplijn opslaan en uitvoeren of plannen
Nadat u andere activiteiten hebt geconfigureerd die vereist zijn voor uw pijplijn, gaat u naar het tabblad Start boven aan de pijplijneditor en selecteert u de knop Opslaan om uw pijplijn op te slaan. Selecteer uitvoeren om deze rechtstreeks uit te voeren of plannen om het te plannen. U kunt hier ook de uitvoeringsgeschiedenis bekijken of andere instellingen configureren.