Κοινή χρήση μέσω


Εκμάθηση Lakehouse: Δημιουργία ενός lakehouse, πρόσληψη δείγματος δεδομένων και δημιουργία αναφοράς

Σε αυτή την εκμάθηση, θα δημιουργήσετε μια λίμνη, θα προσλάβετε δείγματα δεδομένων στον πίνακα Delta, θα εφαρμόσετε μετασχηματισμό όπου απαιτείται και, στη συνέχεια, θα δημιουργήσετε αναφορές. Σε αυτή την εκμάθηση θα μάθετε πώς μπορείτε να κάνετε τα εξής:

  • Δημιουργία μιας λίμνης στο Microsoft Fabric
  • Λήψη και πρόσληψη δείγματος δεδομένων πελατών
  • Προσθήκη πινάκων στο μοντέλο σημασιολογίας
  • Δημιουργία αναφοράς

Εάν δεν έχετε το Microsoft Fabric, εγγραφείτε για ένα δωρεάν σύνολο εκχωρημένων πόρων δοκιμαστικής έκδοσης.

Προαπαιτούμενα στοιχεία

Δημιουργία lakehouse

Σε αυτή την ενότητα, δημιουργείτε μια λίμνη στο Fabric.

  1. Στο Fabric, επιλέξτε Χώροι εργασίας από τη γραμμή περιήγησης.

  2. Για να ανοίξετε τον χώρο εργασίας σας, πληκτρολογήστε το όνομά του στο πλαίσιο αναζήτησης που βρίσκεται στο επάνω μέρος και επιλέξτε το από τα αποτελέσματα αναζήτησης.

  3. Από τον χώρο εργασίας, επιλέξτε Νέο στοιχείο και, στη συνέχεια, επιλέξτε Lakehouse.

  4. Στο παράθυρο διαλόγου Νέα λίμνη, πληκτρολογήστε wwilakehouse στο πεδίο Όνομα.

    Στιγμιότυπο οθόνης του παραθύρου διαλόγου

  5. Επιλέξτε Δημιουργία για να δημιουργήσετε και να ανοίξετε τη νέα λίμνη.

Πρόσληψη δείγματος δεδομένων

Σε αυτή την ενότητα, μπορείτε να προσλάβετε δείγματα δεδομένων πελατών στο lakehouse.

Σημείωμα

Εάν δεν έχετε ρυθμίσει το OneDrive, εγγραφείτε για τη δωρεάν δοκιμαστική έκδοση του Microsoft 365: Δωρεάν δοκιμαστική έκδοση - Δοκιμάστε το Microsoft 365 για έναν μήνα.

  1. Κάντε λήψη του αρχείου dimension_customer.csv από το αποθετήριο δεδομένων Δείγματα Fabric.

  2. Στην Αρχική καρτέλα, στην περιοχή Λήψη δεδομένων στη λίμνη σας, βλέπετε επιλογές για τη φόρτωση δεδομένων στο lakehouse. Επιλέξτε Νέα ροή δεδομένων Gen2.

    Στιγμιότυπο οθόνης που δείχνει πού μπορείτε να επιλέξετε τη Νέα ροή δεδομένων Gen2 για να φορτώσετε δεδομένα στο lakehouse σας.

  3. Στη νέα οθόνη ροής δεδομένων, επιλέξτε Εισαγωγή από ένα αρχείο κειμένου/CSV.

  4. Στην οθόνη Σύνδεση σε προέλευση δεδομένων, επιλέξτε το κουμπί επιλογής Αποστολή αρχείου. Σύρετε και αποθέστε το αρχείο dimension_customer.csv που κατεβάσατε στο βήμα 1. Μετά την αποστολή του αρχείου, επιλέξτε Επόμενο.

    Στιγμιότυπο οθόνης που εμφανίζει πού μπορείτε να επιλέξετε Αποστολή αρχείου και πού να σύρετε το αρχείο που λήφθηκε προηγουμένως.

  5. Από τη σελίδα Προεπισκόπηση δεδομένων αρχείου, κάντε προεπισκόπηση των δεδομένων και επιλέξτε Δημιουργία για να συνεχίσετε και να επιστρέψετε στον καμβά ροής δεδομένων.

  6. Στο τμήμα παραθύρου Ρυθμίσεις ερωτήματος, ενημερώστε το πεδίο Όνομα σε dimension_customer.

    Σημείωμα

    Το Fabric προσθέτει ένα κενό διάστημα και έναν αριθμό στο τέλος του ονόματος του πίνακα από προεπιλογή. Τα ονόματα πινάκων πρέπει να είναι πεζοί και δεν πρέπει να περιέχουν κενά διαστήματα. Μετονομάστε το κατάλληλα και καταργήστε τυχόν διαστήματα από το όνομα του πίνακα.

    Στιγμιότυπο οθόνης του τμήματος παραθύρου ρυθμίσεων ερωτήματος, που εμφανίζει πού μπορείτε να εισαγάγετε το όνομα και να επιλέξετε τον προορισμό δεδομένων.

  7. Σε αυτό το εκπαιδευτικό βοήθημα, συσχετίσατε τα δεδομένα πελατών με ένα lakehouse. Εάν έχετε άλλα στοιχεία δεδομένων που θέλετε να συσχετίσετε με το lakehouse, μπορείτε να τα προσθέσετε:

    1. Από τα στοιχεία μενού, επιλέξτε Προσθήκη προορισμού δεδομένων και επιλέξτε Lakehouse. Από την οθόνη Σύνδεση στον προορισμό δεδομένων, εισέλθετε στον λογαριασμό σας εάν είναι απαραίτητο και επιλέξτε Επόμενο.

    2. Μεταβείτε στο wwilakehouse στον χώρο εργασίας σας.

    3. Εάν ο dimension_customer πίνακας δεν υπάρχει, επιλέξτε τη ρύθμιση Νέος πίνακας και εισαγάγετε το όνομα του πίνακα dimension_customer. Εάν ο πίνακας υπάρχει ήδη, επιλέξτε τη ρύθμιση Υπάρχων πίνακας και επιλέξτε dimension_customer από τη λίστα πινάκων στην εξερεύνηση αντικειμένων. Επιλέξτε Επόμενο.

      Στιγμιότυπο οθόνης που δείχνει πώς μπορείτε να επιλέξετε τον πίνακα προορισμού.

    4. Στο τμήμα παραθύρου Επιλογή ρυθμίσεων προορισμού, επιλέξτε Αντικατάσταση ως μέθοδος ενημέρωσης. Επιλέξτε Αποθήκευση ρυθμίσεων για να επιστρέψετε στον καμβά ροής δεδομένων.

  8. Από τον καμβά ροής δεδομένων, μπορείτε εύκολα να μετασχηματίζετε τα δεδομένα με βάση τις απαιτήσεις της επιχείρησής σας. Για λόγους ευκολίας, δεν πραγματοποιούμε αλλαγές σε αυτό το πρόγραμμα εκμάθησης. Για να συνεχίσετε, επιλέξτε Δημοσίευση στο κάτω δεξιό μέρος της οθόνης.

    Στιγμιότυπο οθόνης του τμήματος παραθύρου ρυθμίσεων ερωτήματος που περιέχει το κουμπί

  9. Ένας περιστρεφόμενος κύκλος δίπλα στο όνομα της ροής δεδομένων υποδεικνύει ότι η δημοσίευση βρίσκεται σε εξέλιξη στην προβολή στοιχείων. Όταν ολοκληρωθεί η δημοσίευση, επιλέξτε ... και επιλέξτε Ιδιότητες. Μετονομάστε τη ροή δεδομένων σε Load Lakehouse Table και επιλέξτε Αποθήκευση.

  10. Επιλέξτε Ανανέωση τώρα δίπλα στο όνομα της ροής δεδομένων για να ανανεώσετε τη ροή δεδομένων. Αυτή η επιλογή εκτελεί τη ροή δεδομένων και μετακινεί δεδομένα από το αρχείο προέλευσης στον πίνακα lakehouse. Ενώ βρίσκεται σε εξέλιξη, βλέπετε έναν περιστρεφόμενο κύκλο στην περιοχή Ανανέωση στήλης στην προβολή στοιχείου.

    Στιγμιότυπο οθόνης που εμφανίζει πού μπορείτε να βρείτε το εικονίδιο

  11. Μόλις ανανεωθεί η ροή δεδομένων, επιλέξτε τη νέα λίμνη στη γραμμή περιήγησης για να προβάλετε τον πίνακα dimension_customer Delta.

    Στιγμιότυπο οθόνης του πίνακα περιήγησης από τον οποίο ανοίγει το lakehouse.

  12. Επιλέξτε τον πίνακα για να κάνετε προεπισκόπηση των δεδομένων του. Μπορείτε επίσης να χρησιμοποιήσετε το τελικό σημείο ανάλυσης SQL της λίμνης για να υποβάλετε ερωτήματα στα δεδομένα με προτάσεις SQL. Επιλέξτε τελικού σημείου ανάλυσης SQL από το αναπτυσσόμενο μενού Lakehouse στην επάνω δεξιά γωνία της οθόνης.

    Στιγμιότυπο οθόνης του πίνακα Delta, που δείχνει πού μπορείτε να επιλέξετε τελικό σημείο ανάλυσης SQL.

  13. Επιλέξτε τον πίνακα dimension_customer για να κάνετε προεπισκόπηση των δεδομένων του ή επιλέξτε Νέο ερώτημα SQL για να συντάξετε προτάσεις SQL.

    Στιγμιότυπο οθόνης της οθόνης τελικού σημείου ανάλυσης SQL, που εμφανίζει πού μπορείτε να επιλέξετε Νέο ερώτημα SQL.

  14. Το παρακάτω δείγμα ερωτήματος συγκεντρώνει το πλήθος γραμμών με βάση τη στήλη BuyingGroup του πίνακα dimension_customer . Τα αρχεία ερωτήματος SQL αποθηκεύονται αυτόματα για μελλοντική αναφορά και μπορείτε να μετονομάσετε ή να διαγράψετε αυτά τα αρχεία με βάση τις ανάγκες σας.

    Για να εκτελέσετε τη δέσμη ενεργειών, επιλέξτε το εικονίδιο Εκτέλεση στο επάνω μέρος του αρχείου δέσμης ενεργειών.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Δημιουργία αναφοράς

Σε αυτή την ενότητα, θα δημιουργήσετε μια αναφορά από τα δεδομένα πρόσληψης.

  1. Προηγουμένως, όλοι οι πίνακες και οι προβολές των λιμνών προστέθηκαν αυτόματα στο σημασιολογικό μοντέλο. Με τις πρόσφατες ενημερώσεις, για τις νέες lakehouse, πρέπει να προσθέσετε με μη αυτόματο τρόπο τους πίνακές σας στο μοντέλο σημασιολογίας. Ανοίξτε τη λίμνη σας και μεταβείτε στην προβολή τελικού σημείου ανάλυσης SQL. Από την καρτέλα Αναφορές , επιλέξτε Διαχείριση προεπιλεγμένου μοντέλου σημασιολογίας και επιλέξτε τους πίνακες που θέλετε να προσθέσετε στο μοντέλο σημασιολογίας. Σε αυτή την περίπτωση, επιλέξτε τον πίνακα dimension_customer .

    Στιγμιότυπο οθόνης όπου μπορείτε να επιλέξετε τους πίνακες για προσθήκη στο μοντέλο σημασιολογίας.

  2. Για να εξασφαλίσετε ότι οι πίνακες στο μοντέλο σημασιολογίας είναι πάντα συγχρονισμένοι, μεταβείτε στην προβολή τελικού σημείου της ανάλυσης SQL και ανοίξτε το τμήμα παραθύρου ρυθμίσεων lakehouse. Επιλέξτε Προεπιλεγμένο σημασιολογικό μοντέλο Power BI και ενεργοποιήστε τη δυνατότητα Συγχρονισμός του προεπιλεγμένου σημασιολογικού μοντέλου Power BI. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Προεπιλεγμένα σημασιολογικά μοντέλα Power BI.

    Στιγμιότυπο οθόνης που εμφανίζει τον τρόπο ενεργοποίησης του συγχρονισμού δεδομένων με το προεπιλεγμένο μοντέλο σημασιολογίας.

  3. Μετά την προσθήκη του πίνακα, το Fabric δημιουργεί ένα σημασιολογικό μοντέλο με το ίδιο όνομα με το lakehouse.

    Στιγμιότυπο οθόνης που εμφανίζει το προεπιλεγμένο σημασιολογικό μοντέλο που δημιουργήθηκε όταν δημιουργήθηκε η νέα λίμνη.

  4. Από το τμήμα παραθύρου μοντέλου σημασιολογίας, μπορείτε να προβάλετε όλους τους πίνακες. Έχετε επιλογές να δημιουργήσετε αναφορές από την αρχή, σελιδοποιημένες αναφορές ή να επιτρέψετε στο Power BI να δημιουργεί αυτόματα μια αναφορά με βάση τα δεδομένα σας. Για αυτό το εκπαιδευτικό βοήθημα, στην περιοχή Εξερεύνηση αυτών των δεδομένων, επιλέξτε Αυτόματη δημιουργία αναφοράς. Στην επόμενη εκμάθηση, θα δημιουργήσουμε μια αναφορά από την αρχή.

    Στιγμιότυπο οθόνης της σελίδας λεπτομερειών σημασιολογικού μοντέλου, που εμφανίζει πού μπορείτε να επιλέξετε Δημιουργία αναφοράς.

  5. Επειδή ο πίνακας είναι μια διάσταση και δεν υπάρχουν μετρήσεις σε αυτόν, το Power BI δημιουργεί μια μέτρηση για το πλήθος γραμμών και τον συγκεντρώνει σε διαφορετικές στήλες και δημιουργεί διαφορετικά γραφήματα, όπως φαίνεται στην παρακάτω εικόνα. Μπορείτε να αποθηκεύσετε αυτήν την αναφορά για το μέλλον, επιλέγοντας Αποθήκευση από την επάνω κορδέλα. Μπορείτε να κάνετε περισσότερες αλλαγές σε αυτήν την αναφορά ώστε να ικανοποιήσετε τις απαιτήσεις σας, συμπεριλαμβάνοντας ή εξαιρώντας άλλους πίνακες ή στήλες.

    Στιγμιότυπο οθόνης μιας σελίδας γρήγορης σύνοψης που εμφανίζει τέσσερα διαφορετικά γραφήματα ράβδων.

Επόμενο βήμα