Γρήγορη εκκίνηση: Δημιουργία της πρώτης ροής δεδομένων σας για λήψη και μετασχηματισμό δεδομένων
Οι ροές δεδομένων είναι μια τεχνολογία προετοιμασίας δεδομένων που βασίζεται στο cloud και που βασίζεται στο cloud. Σε αυτό το άρθρο, δημιουργείτε την πρώτη ροή δεδομένων σας, λαμβάνετε δεδομένα για τη ροή δεδομένων σας και, στη συνέχεια, μετασχηματίζετε τα δεδομένα και δημοσιεύετε τη ροή δεδομένων.
Προαπαιτούμενα στοιχεία
Πριν ξεκινήσετε, απαιτούνται οι ακόλουθες προϋποθέσεις:
- Ένας λογαριασμός μισθωτή Microsoft Fabric με ενεργή συνδρομή. Δημιουργήστε έναν δωρεάν λογαριασμό.
- Βεβαιωθείτε ότι έχετε έναν χώρο εργασίας με δυνατότητα Microsoft Fabric: Δημιουργήστε έναν χώρο εργασίας.
Δημιουργία ροής δεδομένων
Σε αυτή την ενότητα, δημιουργείτε την πρώτη ροή δεδομένων σας.
Μεταβείτε στην εμπειρία του εργοστασίου δεδομένων.
Μεταβείτε στον χώρο εργασίας σας Microsoft Fabric.
Επιλέξτε Δημιουργία και, στη συνέχεια, επιλέξτε Ροή δεδομένων Gen2.
Λήψη δεδομένων
Ας πάρουμε ορισμένα δεδομένα! Σε αυτό το παράδειγμα, λαμβάνετε δεδομένα από μια υπηρεσία OData. Ακολουθήστε τα παρακάτω βήματα για να λάβετε δεδομένα στη ροή δεδομένων σας.
Στο πρόγραμμα επεξεργασίας ροής δεδομένων, επιλέξτε Λήψη δεδομένων και, στη συνέχεια, επιλέξτε Περισσότερα.
Στην Επιλογή προέλευσης δεδομένων, επιλέξτε Προβολή περισσότερων.
Στη Νέα προέλευση, επιλέξτε Άλλα>OData ως προέλευση δεδομένων.
Εισαγάγετε τη διεύθυνση URL
https://services.odata.org/v4/northwind/northwind.svc/
και, στη συνέχεια, επιλέξτε Επόμενο.Επιλέξτε τους πίνακες Orders και Customers και, στη συνέχεια, επιλέξτε Δημιουργία.
Μπορείτε να μάθετε περισσότερα σχετικά με την εμπειρία λήψης δεδομένων και τη λειτουργικότητα στο θέμα Λήψη επισκόπησης δεδομένων.
Εφαρμογή μετασχηματισμών και δημοσίευση
Φορτώσατε τα δεδομένα σας στην πρώτη ροή δεδομένων σας τώρα. Συγχαρητήρια! Τώρα είναι ώρα να εφαρμόσετε μερικούς μετασχηματισμούς προκειμένου να φέρετε αυτά τα δεδομένα στο επιθυμητό σχήμα.
Μπορείτε να κάνετε αυτή την εργασία από το πρόγραμμα επεξεργασίας Power Query. Μπορείτε να βρείτε μια λεπτομερή επισκόπηση του προγράμματος επεξεργασίας Power Query στο περιβάλλον εργασίας χρήστη Power Query.
Ακολουθήστε αυτά τα βήματα για να εφαρμόσετε μετασχηματισμούς και να δημοσιεύσετε:
Βεβαιωθείτε ότι τα εργαλεία προφίλ δεδομένων είναι ενεργοποιημένα μεταβαίνοντας στις Καθολικές επιλογές επιλογών>>.
Επίσης, βεβαιωθείτε ότι ενεργοποιείτε την προβολή διαγράμματος, χρησιμοποιώντας τις επιλογές στην καρτέλα Προβολή στην κορδέλα του προγράμματος επεξεργασίας Power Query ή επιλέγοντας το εικονίδιο προβολής διαγράμματος στην κάτω δεξιά πλευρά του παραθύρου του Power Query.
Στον πίνακα Orders, υπολογίζετε τον συνολικό αριθμό παραγγελιών ανά πελάτη. Για να επιτύχετε αυτόν τον στόχο, επιλέξτε τη στήλη CustomerID στην προεπισκόπηση δεδομένων και, στη συνέχεια, επιλέξτε Ομαδοποίηση κατά στην καρτέλα Μετασχηματισμός στην κορδέλα.
Εκτελείτε ένα πλήθος γραμμών ως συνάθροιση εντός της ομάδας κατά. Μπορείτε να μάθετε περισσότερα σχετικά με τις δυνατότητες Ομαδοποίηση κατά στη δυνατότητα Ομαδοποίηση ή σύνοψη γραμμών.
Μετά την ομαδοποίηση των δεδομένων στον πίνακα Orders, θα λάβουμε έναν πίνακα δύο στηλών με τα CustomerID και Count ως τις στήλες.
Στη συνέχεια, θέλετε να συνδυάσετε δεδομένα από τον πίνακα Customers με το Πλήθος παραγγελιών ανά πελάτη. Για να συνδυάσετε δεδομένα, επιλέξτε το ερώτημα Customers στην Προβολή διαγράμματος και χρησιμοποιήστε το μενού "⋮" για να αποκτήσετε πρόσβαση στα ερωτήματα συγχώνευσης ως νέο μετασχηματισμό.
Ρυθμίστε τις παραμέτρους της λειτουργίας Συγχώνευση όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης, επιλέγοντας CustomerID ως αντίστοιχη στήλη και στους δύο πίνακες. Επιλέξτε Ok.
Στιγμιότυπο οθόνης του παραθύρου Συγχώνευση, με τον αριστερό πίνακα για συγχώνευση να έχει οριστεί στον πίνακα Customers και τον δεξιό πίνακα για συγχώνευση να έχει οριστεί στον πίνακα Orders. Η στήλη CustomerID επιλέγεται για τους πίνακες Customers και Orders. Επίσης, το Join Kind έχει οριστεί σε Αριστερό εξωτερικό. Όλες οι άλλες επιλογές ορίζονται στην προεπιλεγμένη τιμή τους.
Κατά την εκτέλεση των ερωτημάτων Συγχώνευση ως νέας λειτουργίας, λαμβάνετε ένα νέο ερώτημα με όλες τις στήλες από τον πίνακα Customers και μία στήλη με ένθετα δεδομένα από τον πίνακα Orders.
Σε αυτό το παράδειγμα, σας ενδιαφέρει μόνο ένα υποσύνολο των στηλών στον πίνακα Customers. Μπορείτε να επιλέξετε αυτές τις στήλες χρησιμοποιώντας την προβολή σχήματος. Ενεργοποιήστε την προβολή σχήματος μέσα στο κουμπί εναλλαγής στην κάτω δεξιά γωνία του προγράμματος επεξεργασίας ροών δεδομένων.
Η προβολή σχήματος παρέχει μια εστιασμένη προβολή στις πληροφορίες σχήματος ενός πίνακα, συμπεριλαμβανομένων των ονομάτων στηλών και των τύπων δεδομένων. Η προβολή σχήματος διαθέτει ένα σύνολο εργαλείων σχήματος που είναι διαθέσιμα μέσω μιας καρτέλας κορδέλας περιβάλλοντος. Σε αυτό το σενάριο, επιλέγετε τις στήλες CustomerID, CompanyName και Orders (2 ), έπειτα επιλέγετε το κουμπί Κατάργηση στηλών και, στη συνέχεια, επιλέγετε Κατάργηση άλλων στηλών στην καρτέλα Εργαλεία σχήματος.
Η στήλη Παραγγελίες (2) περιέχει ένθετες πληροφορίες που προκύπτουν από τη λειτουργία συγχώνευσης που εκτελέσατε πριν από λίγα βήματα. Τώρα, επιστρέψτε στην προβολή δεδομένων επιλέγοντας το κουμπί Εμφάνιση προβολής δεδομένων δίπλα στο κουμπί Εμφάνιση προβολής σχήματος στην κάτω δεξιά γωνία του περιβάλλοντος εργασίας χρήστη. Στη συνέχεια, χρησιμοποιήστε τον μετασχηματισμό Ανάπτυξη στήλης στην κεφαλίδα στήλης Παραγγελίες (2) για να επιλέξετε τη στήλη Πλήθος .
Ως τελική λειτουργία, θέλετε να ταξινομήσετε τους πελάτες σας με βάση τον αριθμό παραγγελιών τους. Επιλέξτε τη στήλη Πλήθος και, στη συνέχεια, επιλέξτε το κουμπί Στήλη κατάταξης κάτω από την καρτέλα Προσθήκη στήλης στην κορδέλα.
Διατηρήστε τις προεπιλεγμένες ρυθμίσεις στη Στήλη κατάταξης. Στη συνέχεια, επιλέξτε OK για να εφαρμόσετε αυτόν τον μετασχηματισμό.
Τώρα, μετονομάστε το ερώτημα που προκύπτει σε Ranked Customers χρησιμοποιώντας το τμήμα παραθύρου Ρυθμίσεις ερωτήματος στη δεξιά πλευρά της οθόνης.
Τώρα που ολοκληρώσατε τον μετασχηματισμό και τον συνδυασμό των δεδομένων σας, μπορείτε να ρυθμίσετε τις παραμέτρους του προορισμού εξόδου. Επιλέξτε Επιλογή προορισμού δεδομένων στο κάτω μέρος του τμήματος παραθύρου Ρυθμίσεις ερωτήματος.
Για αυτό το βήμα, μπορείτε να ρυθμίσετε τις παραμέτρους μιας εξόδου στο lakehouse εάν έχετε ένα διαθέσιμο ή να παραλείψετε αυτό το βήμα εάν δεν το κάνετε. Σε αυτήν την εμπειρία, μπορείτε να ρυθμίσετε τις παραμέτρους της λίμνης προορισμού και του πίνακα για τα αποτελέσματα του ερωτήματός σας, επιπλέον της μεθόδου ενημέρωσης (Προσάρτηση ή Αντικατάσταση).
Η ροή δεδομένων σας είναι τώρα έτοιμη για δημοσίευση. Εξετάστε τα ερωτήματα στην προβολή διαγράμματος και, στη συνέχεια, επιλέξτε Δημοσίευση.
Τώρα επιστρέφετε στον χώρο εργασίας. Ένα εικονίδιο στροφών δίπλα στο όνομα της ροής δεδομένων υποδεικνύει ότι η δημοσίευση βρίσκεται σε εξέλιξη. Μόλις ολοκληρωθεί η δημοσίευση, η ροή δεδομένων σας είναι έτοιμη για ανανέωση!
Σημαντικό
Όταν δημιουργείται το πρώτο Dataflow Gen2 σε έναν χώρο εργασίας, τα στοιχεία Lakehouse και Warehouse εκχωρούνται μαζί με τα σχετικά τελικά μοντέλα ανάλυσης SQL και σημασιολογικά μοντέλα. Αυτά τα στοιχεία είναι κοινόχρηστα από όλες τις ροές δεδομένων στον χώρο εργασίας και απαιτούνται για τη λειτουργία του Dataflow Gen2, δεν πρέπει να διαγραφούν και δεν προορίζονται να χρησιμοποιηθούν απευθείας από τους χρήστες. Τα στοιχεία είναι μια λεπτομέρεια υλοποίησης του Dataflow Gen2. Τα στοιχεία δεν είναι ορατά στον χώρο εργασίας, αλλά μπορεί να είναι προσβάσιμα σε άλλες εμπειρίες όπως οι εμπειρίες Σημειωματάριο, Ανάλυση SQL, Lakehouse και Αποθήκη. Μπορείτε να αναγνωρίσετε τα στοιχεία από το πρόθεμα τους στο όνομα. Το πρόθεμα των στοιχείων είναι "Ροές δεδομένωνStaging".
Στον χώρο εργασίας σας, επιλέξτε το εικονίδιο Προγραμματισμός ανανέωσης .
Ενεργοποιήστε την προγραμματισμένη ανανέωση, επιλέξτε Προσθήκη άλλης ώρας και ρυθμίστε τις παραμέτρους της ανανέωσης, όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης.
Στιγμιότυπο οθόνης των επιλογών προγραμματισμένης ανανέωσης, με ενεργοποιημένη την προγραμματισμένη ανανέωση, τη συχνότητα ανανέωσης που έχει οριστεί σε Ημερήσια, τη Ζώνη ώρας που έχει οριστεί σε συντονισμένη παγκόσμια ώρα και την Ώρα που έχει οριστεί σε 4:00 Π.Μ. Το κουμπί ενεργοποίησης, η επιλογή Προσθήκη άλλης ώρας, ο κάτοχος της ροής δεδομένων και το κουμπί εφαρμογής δίνονται έμφαση σε όλα.
Εκκαθάριση των πόρων
Εάν δεν πρόκειται να συνεχίσετε να χρησιμοποιείτε αυτή τη ροή δεδομένων, διαγράψτε τη ροή δεδομένων ακολουθώντας τα παρακάτω βήματα:
Μεταβείτε στον χώρο εργασίας σας Microsoft Fabric.
Επιλέξτε τα κατακόρυφα αποσιωπητικά δίπλα στο όνομα της ροής δεδομένων σας και, στη συνέχεια, επιλέξτε Διαγραφή.
Επιλέξτε Διαγραφή για να επιβεβαιώσετε τη διαγραφή της ροής δεδομένων σας.
Σχετικό περιεχόμενο
Η ροή δεδομένων σε αυτό το δείγμα σάς δείχνει πώς μπορείτε να φορτώσετε και μετασχηματίζετε δεδομένα στο Dataflow Gen2. Μάθατε πώς να εκτελείτε τις εξής ενέργειες:
- Δημιουργήστε μια ροή δεδομένων Gen2.
- Μετασχηματισμός δεδομένων.
- Ρυθμίστε τις παραμέτρους προορισμού για μετασχηματισμένο δεδομένα.
- Εκτελέστε και προγραμματίστε τη διοχέτευση δεδομένων σας.
Προχωρήστε στο επόμενο άρθρο για να μάθετε πώς μπορείτε να δημιουργήσετε την πρώτη διοχέτευση δεδομένων.