Dataflow Gen2 με υποστήριξη ενοποίησης CI/CD και Git (Προεπισκόπηση)
Το Dataflow Gen2 υποστηρίζει πλέον συνεχή ενοποίηση/συνεχή ανάπτυξη (CI/CD) και ενοποίηση Git. Αυτή η δυνατότητα σάς επιτρέπει να δημιουργείτε, να επεξεργάζεστε και να διαχειρίζεστε ροές δεδομένων σε ένα αποθετήριο Git που είναι συνδεδεμένο με τον χώρο εργασίας σας fabric. Επιπλέον, μπορείτε να χρησιμοποιήσετε τη δυνατότητα διοχετεύσεων ανάπτυξης για να αυτοματοποιήσετε την ανάπτυξη ροών δεδομένων από τον χώρο εργασίας σας σε άλλους χώρους εργασίας. Αυτό το άρθρο εμβαθύνει στον τρόπο χρήσης του Dataflow Gen2 με ενοποίηση CI/CD και Git στο Fabric Data Factory.
Νέες δυνατότητες
Με το Dataflow Gen2 (προεπισκόπηση CI/CD), μπορείτε τώρα:
- Χρησιμοποιήστε την υποστήριξη ενοποίησης Git για το Dataflow Gen2.
- Χρησιμοποιήστε τη δυνατότητα διοχετεύσεων ανάπτυξης για να αυτοματοποιήσετε την ανάπτυξη ροών δεδομένων από τον χώρο εργασίας σας σε άλλους χώρους εργασίας.
- Χρησιμοποιήστε τις ρυθμίσεις και τον προγραμματισμό Fabric για να ανανεώσετε και να επεξεργαστείτε τις ρυθμίσεις για το Dataflow Gen2.
- Δημιουργήστε το Dataflow Gen2 απευθείας σε έναν φάκελο χώρου εργασίας.
Προαπαιτούμενα στοιχεία
Για να ξεκινήσετε, πρέπει να συμπληρώσετε τις ακόλουθες προϋποθέσεις:
- Να έχετε έναν λογαριασμό μισθωτή Microsoft Fabric με ενεργή συνδρομή. Δημιουργήστε έναν λογαριασμό δωρεάν.
- Βεβαιωθείτε ότι έχετε έναν χώρο εργασίας με δυνατότητα Microsoft Fabric.
- Για να απολαύσετε την ενοποίηση Git, βεβαιωθείτε ότι είναι ενεργοποιημένη για τον χώρο εργασίας σας. Για να μάθετε περισσότερα σχετικά με την ενεργοποίηση της ενοποίησης Git, μεταβείτε στην επιλογή Γρήγορα αποτελέσματα με την ενοποίηση Git.
Δημιουργία ροής δεδομένων Gen2 με υποστήριξη CI/CD και Git
Για να δημιουργήσετε ένα Dataflow Gen2 με υποστήριξη CI/CD και Git, ακολουθήστε τα εξής βήματα:
Στον χώρο εργασίας Fabric, επιλέξτε Δημιουργία νέου στοιχείου και, στη συνέχεια, επιλέξτε Ροή δεδομένων Gen2.
Δώστε ένα όνομα στη ροή δεδομένων σας και ενεργοποιήστε την ενοποίηση με το Git. Μετά επιλέξτε Δημιουργία.
Η ροή δεδομένων δημιουργείται και ανακατευθύνεστε στον καμβά σύνταξης ροής δεδομένων. Τώρα, μπορείτε να ξεκινήσετε τη δημιουργία της ροής δεδομένων σας.
Όταν τελειώσετε, επιλέξτε Αποθήκευση και εκτέλεση.
Μετά τη δημοσίευση, η ροή δεδομένων έχει κατάσταση χωρίς δέσμευση.
Για να καταθέσετε τη ροή δεδομένων στο αποθετήριο δεδομένων Git, επιλέξτε το εικονίδιο στοιχείου ελέγχου προέλευσης στην επάνω δεξιά γωνία της προβολής χώρου εργασίας.
Επιλέξτε όλες τις αλλαγές που θέλετε να πραγματοποιήσετε και, στη συνέχεια, επιλέξτε Δέσμευση.
Έχετε τώρα ένα Dataflow Gen2 με υποστήριξη CI/CD και Git. Σας προτείνουμε να ακολουθήσετε τις βέλτιστες πρακτικές για την εργασία με ενοποίηση CI/CD και Git στο Fabric που περιγράφεται στο Σενάριο 2 - Ανάπτυξη με χρήση άλλου χώρου εργασίας.
Ανανέωση ροής δεδομένων Gen2 ή προγραμματισμός ανανέωσης
Μπορείτε να ανανεώσετε μια ροή δεδομένων Gen2 με υποστήριξη CI/CD και Git με δύο τρόπους, με μη αυτόματο τρόπο ή με προγραμματισμό ανανέωσης. Οι παρακάτω ενότητες περιγράφουν πώς μπορείτε να ανανεώσετε μια ροή δεδομένων Gen2 με υποστήριξη CI/CD και Git.
Ανανέωση τώρα
Στον χώρο εργασίας fabric, επιλέξτε το εικονίδιο αποσιωπητικά περισσότερων επιλογών δίπλα στη ροή δεδομένων που θέλετε να ανανεώσετε.
Επιλέξτε Άμεση ανανέωση.
Προγραμματισμός ανανέωσης
Εάν η ροή δεδομένων σας χρειάζεται να ανανεώνεται σε τακτά χρονικά διαστήματα, μπορείτε να προγραμματίσετε την ανανέωση χρησιμοποιώντας τον προγραμματισμό Fabric.
Στον χώρο εργασίας Fabric, επιλέξτε το εικονίδιο αποσιωπητικά με περισσότερες επιλογές δίπλα στη ροή δεδομένων που θέλετε να ανανεώσετε.
Επιλέξτε Χρονοδιάγραμμα.
Στη σελίδα χρονοδιαγράμματος, μπορείτε να ορίσετε τη συχνότητα ανανέωσης και την ώρα έναρξης και λήξης, μετά την οποία μπορείτε να εφαρμόσετε αλλαγές.
Για να ξεκινήσετε τώρα την ανανέωση, επιλέξτε το κουμπί Ανανέωση .
Ιστορικό ανανέωσης και ρυθμίσεις
Για να προβάλετε το ιστορικό ανανέωσης της ροής δεδομένων, μπορείτε είτε να επιλέξετε την καρτέλα ιστορικό ανανέωσης στο αναπτυσσόμενο μενού είτε να μεταβείτε στο κέντρο παρακολούθησης και να επιλέξετε τη ροή δεδομένων της οποίας θέλετε να προβάλετε το ιστορικό ανανέωσης.
Ρυθμίσεις για το Dataflow Gen2 με CI/CD
Η πρόσβαση στις ρυθμίσεις του νέου Dataflow Gen2 με υποστήριξη CI/CD και Git είναι παρόμοια με οποιοδήποτε άλλο στοιχείο Fabric. Μπορείτε να αποκτήσετε πρόσβαση στις ρυθμίσεις επιλέγοντας το εικονίδιο αποσιωπητικά περισσότερων επιλογών δίπλα στη ροή δεδομένων και επιλέγοντας τις ρυθμίσεις.
Περιορισμοί και γνωστά προβλήματα
- Τα αντικείμενα σχεδίασης προεργασίας βρίσκονται σε ορισμένες εμπειρίες ορατές όπως το περιβάλλον εργασίας χρήστη ALM. Τα αντικείμενα σχεδίασης προετοιμασίας θα είναι κρυφά σε όλες τις εμπειρίες στο μέλλον.
- Όταν διαγράφετε την τελευταία ροή δεδομένων Gen2 με υποστήριξη CI/CD και Git, τα αντικείμενα σχεδίασης προεργασίας γίνονται ορατά στον χώρο εργασίας και είναι ασφαλές να διαγραφούν από τον χρήστη.
- Ορισμένες εμπειρίες αναφέρουν υποστήριξη για API REST, αλλά αυτά τα API δεν είναι ακόμα διαθέσιμα. Όλα τα Dataflow Gen2 με υποστήριξη CI/CD και Git θα υποστηρίζουν το Δημόσιο API Fabric στο μέλλον.
- Η ενορχήστρωση μιας ανανέωσης του Dataflow Gen2 με υποστήριξη CI/CD και Git δεν είναι δυνατή στις διοχετεύσεις δεδομένων Fabric.
- Η προβολή χώρου εργασίας δεν εμφανίζει εάν μια ανανέωση είναι σε εξέλιξη για τη ροή δεδομένων.
- Το Copilot για dataflow Gen2 με υποστήριξη CI/CD και Git δεν είναι ακόμα διαθέσιμο.
- Οι συνδέσεις πύλης VNet δεν υποστηρίζονται ακόμα στην εμπειρία σύνταξης ροής δεδομένων.
- Δεν μπορείτε να εξαγάγετε τα Dataflow.json από το μενού του χώρου εργασίας. Λύσεις που σας επιτρέπουν να εξαγάγετε τη ροή δεδομένων είναι οι εξής:
- Χρησιμοποιήστε το Δημόσιο API Fabric για να λάβετε το Dataflow.json.
- Χρησιμοποιήστε τη δυνατότητα εξαγωγής προτύπου Power Query για να εξαγάγετε τον ορισμό ροής δεδομένων.
- Χρησιμοποιήστε την Εξερεύνηση OneLake στον χώρο εργασίας για να λάβετε τον ορισμό της ροής δεδομένων.
- Το Dataflow Gen2 με υποστήριξη CI/CD και Git δεν υποστηρίζει τη δυνατότητα ανάληψης κυριότητας στον χώρο εργασίας Fabric. Επομένως, μόνο ο δημιουργός της ροής δεδομένων μπορεί να επεξεργαστεί τη ροή δεδομένων. Εάν θέλετε να εργαστείτε μαζί σε μια ροή δεδομένων, μπορείτε να χρησιμοποιήσετε διακλαδώσεις στο αποθετήριο δεδομένων Git και να δημιουργήσετε ένα αίτημα έλξης για να συγχωνεύσετε τις αλλαγές. Για περισσότερες πληροφορίες, μεταβείτε στο Σενάριο 2 - Ανάπτυξη με χρήση ενός άλλου χώρου εργασίας.
- Κατά τη διακλάδωση σε έναν άλλο χώρο εργασίας, μια ανανέωση Dataflow Gen2 ενδέχεται να αποτύχει με το μήνυμα ότι δεν ήταν δυνατή η αναζήτηση της λίμνης προετοιμασίας. Όταν συμβαίνει αυτό, δημιουργήστε ένα νέο Dataflow Gen2 με υποστήριξη CI/CD και Git στον χώρο εργασίας για να ενεργοποιήσετε τη δημιουργία του lakehouse προετοιμασίας. Μετά από αυτό, όλες οι άλλες ροές δεδομένων στον χώρο εργασίας θα πρέπει να αρχίσουν να λειτουργούν ξανά.
- Όταν δημιουργείτε ένα νέο στοιχείο στον χώρο εργασίας σας, μπορεί να εμφανίζει το στοιχείο "Dataflow Gen2 (CI/CD, προεπισκόπηση)". Αγνοήστε αυτό και ακολουθήστε τις οδηγίες που περιγράφονται σε αυτό το άρθρο. Μπορεί να χρειαστεί λίγος χρόνος μέχρι η περιοχή σας να εμφανίσει το πλαίσιο ελέγχου για την ενεργοποίηση της υποστήριξης CI/CD και Git.
- Η Γρήγορη αντιγραφή ενδέχεται να μην είναι ενεργοποιημένη από προεπιλογή στη ροή δεδομένων σας. Αυτό μπορείτε να το ενεργοποιήσετε χρησιμοποιώντας τις ρυθμίσεις ροής δεδομένων.