Σενάρια χρήσης power BI: Προετοιμασία δεδομένων για προχωρημένους
Σημείωμα
Αυτό το άρθρο αποτελεί μέρος της σειράς άρθρων σχεδιασμού υλοποίησης Power BI. Αυτή η σειρά εστιάζει κυρίως στην εμπειρία Power BI στο Microsoft Fabric. Για μια εισαγωγή στη σειρά, ανατρέξτε στο θέμα Σχεδιασμός υλοποίησης Power BI.
Η προετοιμασία δεδομένων (μερικές φορές αναφέρεται ως ETL, το οποίο είναι ένα ακρωνύμιο για τις δραστηριότητες εξαγωγής, μετασχηματισμού και φόρτωσης) συχνά απαιτεί μεγάλη προσπάθεια. Ο χρόνος, οι δεξιότητες και η προσπάθεια που συνεπάγεται η συλλογή, η εκκαθάριση, ο συνδυασμός και ο εμπλουτισμός δεδομένων εξαρτώνται από την ποιότητα και τη δομή των δεδομένων προέλευσης.
Η επένδυση χρόνου και προσπάθειας σε κεντρική προετοιμασία δεδομένων συμβάλλει στα εξής:
- Βελτιώστε την επαναχρησιμότητα και αποκτήστε μέγιστη αξία από τις προσπάθειες προετοιμασίας δεδομένων.
- Βελτιώστε τη δυνατότητα παροχής συνεπών δεδομένων σε πολλές ομάδες.
- Μειώστε το επίπεδο προσπάθειας που απαιτείται από άλλους δημιουργούς περιεχομένου.
- Επίτευξη κλίμακας και επιδόσεων.
Το σενάριο χρήσης προετοιμασίας δεδομένων για προχωρημένους επεκτείνεται στο σενάριο προετοιμασίας δεδομένων αυτοεξυπηρέτησης . Η προετοιμασία δεδομένων για προχωρημένους αφορά την αύξηση της επαναχρησιμοποίησης ροής δεδομένων από πολλούς χρήστες σε διάφορες ομάδες και για διάφορες περιπτώσεις χρήσης.
Οι ξεχωριστοί χώροι εργασίας, οργανωμένοι κατά σκοπό ροής δεδομένων, είναι χρήσιμοι όταν παρέχεται έξοδος ροής δεδομένων σε πολλούς δημιουργούς μοντέλων σημασιολογίας, ειδικά όταν βρίσκονται σε διαφορετικές ομάδες στον οργανισμό. Οι ξεχωριστοί χώροι εργασίας είναι επίσης χρήσιμοι για τη διαχείριση ρόλων ασφαλείας όταν τα άτομα που δημιουργούν και διαχειρίζονται ροές δεδομένων διαφέρουν από αυτά που καταναλώνουν οι χρήστες.
Σημείωμα
Το σύνθετο σενάριο προετοιμασίας δεδομένων είναι το δεύτερο από τα σενάρια προετοιμασίας δεδομένων. Αυτό το σενάριο βασίζεται στο τι μπορεί να γίνει με τις κεντρικές ροές δεδομένων, όπως περιγράφεται στο σενάριο προετοιμασίας δεδομένων αυτοεξυπηρέτησης .
Το σύνθετο σενάριο προετοιμασίας δεδομένων είναι ένα από τα σενάρια BI αυτοεξυπηρέτησης. Ωστόσο, ένα κεντρικό μέλος της ομάδας μπορεί να χρησιμοποιήσει τις τεχνικές με παρόμοιο τρόπο όπως περιγράφεται στο διαχειριζόμενο σενάριο αυτοεξυπηρέτησης BI . Για μια πλήρη λίστα των σεναρίων αυτοεξυπηρέτησης, ανατρέξτε στο άρθρο Σενάρια χρήσης Power BI.
Για συντομία, ορισμένες πτυχές που περιγράφονται στο θέμα σενάρια συνεργασίας και παράδοσης περιεχομένου δεν καλύπτονται σε αυτό το άρθρο. Για πλήρη κάλυψη, διαβάστε πρώτα αυτά τα άρθρα.
Διάγραμμα σεναρίου
Φιλοδώρημα
Συνιστούμε να εξετάσετε το σενάριο χρήσης προετοιμασίας δεδομένων από τον χρήστη εάν δεν είστε εξοικειωμένοι με αυτό. Το σύνθετο σενάριο προετοιμασίας δεδομένων από τον χρήστη βασίζεται σε αυτό το σενάριο.
Η εστίαση σε αυτό το σύνθετο σενάριο προετοιμασίας δεδομένων είναι στα εξής:
- Η χρήση ξεχωριστών ροών δεδομένων με βάση τον σκοπό: προεργασία, μετασχηματισμό ή τελική. Συνιστούμε τη χρήση κομποστοποιήσιμων δομικών στοιχείων για την απόκτηση μεγαλύτερης επαναχρησιμοποίησης, σε διάφορους συνδυασμούς, για την υποστήριξη συγκεκριμένων απαιτήσεων χρήστη. Τα μπλοκ δόμησης με δυνατότητα σύνθεσης περιγράφονται παρακάτω σε αυτό το άρθρο.
- Η χρήση ξεχωριστών χώρων εργασίας που υποστηρίζουν δημιουργούς ροής δεδομένων ή καταναλωτές ροών δεδομένων. Οι δημιουργός μοντέλων δεδομένων, οι οποίοι καταναλώνουν ροές δεδομένων, μπορεί να είναι σε διαφορετικές ομάδες ή/και να έχουν διαφορετικές περιπτώσεις χρήσης.
- Η χρήση συνδεδεμένων πινάκων (γνωστών επίσης ως συνδεδεμένων οντοτήτων), υπολογισμένων πινάκων (γνωστών και ως υπολογισμένων οντοτήτων) και της βελτιωμένης μηχανής υπολογιστικής λειτουργίας.
Σημείωμα
Ορισμένες φορές οι όροι μοντέλο σημασιολογίας και μοντέλο δεδομένων χρησιμοποιούνται εναλλάξ. Γενικά, όσον αφορά την υπηρεσία Power BI, αναφέρεται ως σημασιολογικό μοντέλο. Όσον αφορά τον προγραμματισμό, αναφέρεται ως μοντέλο δεδομένων (ή μοντέλο για συντομία). Σε αυτό το άρθρο, και οι δύο όροι έχουν την ίδια έννοια. Παρομοίως, ένας δημιουργός μοντέλου σημασιολογίας και ένας δημιουργός μοντέλων δεδομένων έχουν το ίδιο νόημα.
Το παρακάτω διάγραμμα απεικονίζει μια επισκόπηση υψηλού επιπέδου των συνηθέστερων ενεργειών χρήστη και στοιχείων Power BI που υποστηρίζουν το σενάριο σύνθετης προετοιμασίας δεδομένων.
Φιλοδώρημα
Σας προτείνουμε να κάνετε λήψη του διαγράμματος σεναρίου εάν θα θέλατε να το ενσωματώσετε στην παρουσίαση, την τεκμηρίωση ή την καταχώρηση ιστολογίου σας ή να το εκτυπώσετε ως αφίσα τοίχου. Επειδή πρόκειται για μια εικόνα ανυσματικών γραφικών με δυνατότητα κλιμάκωσης (SVG), μπορείτε να την κλιμακώσετε προς τα επάνω ή προς τα κάτω χωρίς απώλεια ποιότητας.
Το διάγραμμα σεναρίου απεικονίζει τις ακόλουθες ενέργειες, εργαλεία και δυνατότητες του χρήστη:
Στοιχείο | Περιγραφή |
---|---|
Ο δημιουργός της ροής δεδομένων αναπτύσσει μια συλλογή πινάκων μέσα σε μια ροή δεδομένων. Για μια ροή δεδομένων που προορίζεται για επαναχρησιμοποίηση, είναι σύνηθες (αλλά δεν απαιτείται) ότι ο δημιουργός ανήκει σε μια κεντρική ομάδα που υποστηρίζει χρήστες πέρα από τα όρια του οργανισμού (όπως IT, εταιρικό BI ή το Κέντρο αριστείας). | |
Η ροή δεδομένων συνδέεται σε δεδομένα από μία ή περισσότερες προελεύσεις δεδομένων. | |
Ορισμένες προελεύσεις δεδομένων ενδέχεται να απαιτούν μια πύλη δεδομένων εσωτερικής εγκατάστασης ή μια πύλη VNet για την ανανέωση δεδομένων, όπως αυτές που βρίσκονται εντός ενός ιδιωτικού εταιρικού δικτύου. Αυτές οι πύλες χρησιμοποιούνται τόσο για τη σύνταξη της ροής δεδομένων στο Power Query Online όσο και για την ανανέωση της ροής δεδομένων. | |
Όλοι οι χώροι εργασίας που εμπλέκονται έχουν τη λειτουργία άδειας χρήσης τους ορισμένη σε Εκχωρημένους πόρους Fabric, Premium εκχωρημένους πόρους, Premium ανά χρήστη ή Embedded. Αυτές οι λειτουργίες άδειας χρήσης επιτρέπουν τη χρήση συνδεδεμένων πινάκων και υπολογισμένων πινάκων σε χώρους εργασίας, οι οποίοι απαιτούνται σε αυτό το σενάριο. | |
Οι δημιουργοί ροών δεδομένων αναπτύσσουν ροές δεδομένων χρησιμοποιώντας το Power Query Online, το οποίο είναι μια έκδοση του Power Query που βασίζεται στο web. | |
Μια ροή δεδομένων προεργασίας δημιουργείται σε έναν χώρο εργασίας που είναι αποκλειστικός στην κεντρική διαχείριση των ροών δεδομένων. Μια ροή δεδομένων προεργασίας αντιγράφει τα ανεπεξέργαστα δεδομένα ως έχουν από την προέλευση. Λίγοι, αν υπάρχουν, μετασχηματισμοί εφαρμόζονται. | |
Στον ίδιο χώρο εργασίας δημιουργείται μια ροή δεδομένων μετασχηματισμού (γνωστή και ως εκκαθαρισμένη ροή δεδομένων). Αντλεί δεδομένα χρησιμοποιώντας συνδεδεμένους πίνακες με τη ροή δεδομένων προεργασίας. Οι υπολογισμένοι πίνακες περιλαμβάνουν βήματα μετασχηματισμού που προετοιμάζουν, εκκαθαρίζουν και αναδιαμορφίζουν τα δεδομένα. | |
Οι δημιουργοί ροών δεδομένων έχουν πρόσβαση για τη διαχείριση περιεχομένου στον χώρο εργασίας που είναι αποκλειστικός στην κεντρική διαχείριση των ροών δεδομένων. | |
Υπάρχουν ένας ή περισσότεροι χώροι εργασίας που προορίζονται για την παροχή πρόσβασης στην τελική ροή δεδομένων, η οποία παρέχει δεδομένα έτοιμα για παραγωγή σε μοντέλα δεδομένων. | |
Η τελική ροή δεδομένων δημιουργείται σε έναν χώρο εργασίας που είναι διαθέσιμος στους δημιουργούς μοντέλων δεδομένων. Αντλεί δεδομένα χρησιμοποιώντας συνδεδεμένους πίνακες στη ροή δεδομένων μετασχηματισμού. Οι υπολογισμένοι πίνακες αντιπροσωπεύουν την προετοιμασμένη έξοδο που είναι ορατή στους δημιουργούς μοντέλων δεδομένων στους οποίους εκχωρείται ο ρόλος θεατή χώρου εργασίας. | |
Οι δημιουργοί σημασιολογικών μοντέλων (που καταναλώνουν την έξοδο ροής δεδομένων) έχουν πρόσβαση θεατή στον χώρο εργασίας που περιέχει την τελική έξοδο ροής δεδομένων. Οι δημιουργοί ροών δεδομένων έχουν επίσης πρόσβαση για τη διαχείριση και δημοσίευση περιεχομένου στον χώρο εργασίας (δεν απεικονίζεται στο διάγραμμα σεναρίου). | |
Οι δημιουργοί μοντέλου σημασιολογίας χρησιμοποιούν την τελική ροή δεδομένων ως προέλευση δεδομένων κατά την ανάπτυξη ενός μοντέλου δεδομένων στο Power BI Desktop. Όταν είναι έτοιμο, ο δημιουργός μοντέλου σημασιολογίας δημοσιεύει το αρχείο Power BI Desktop (.pbix) που περιέχει το μοντέλο δεδομένων στην υπηρεσία Power BI (δεν απεικονίζεται στο διάγραμμα σεναρίου). | |
Οι διαχειριστές Fabric διαχειρίζονται ρυθμίσεις στην πύλη διαχείρισης. | |
Στην πύλη διαχείρισης, οι διαχειριστές του Power BI μπορούν να ρυθμίσουν συνδέσεις Azure για την αποθήκευση δεδομένων ροής δεδομένων στον λογαριασμό azure Data Lake Storage Gen2 (ADLS Gen2). Οι ρυθμίσεις περιλαμβάνουν την εκχώρηση ενός λογαριασμού χώρου αποθήκευσης σε επίπεδο μισθωτή και την ενεργοποίηση δικαιωμάτων αποθήκευσης σε επίπεδο χώρου εργασίας. | |
Από προεπιλογή, οι ροές δεδομένων αποθηκεύουν δεδομένα χρησιμοποιώντας εσωτερικό χώρο αποθήκευσης τον οποίο διαχειρίζεται η υπηρεσία Power BI. Προαιρετικά, η έξοδος δεδομένων από τη ροή δεδομένων μπορεί να αποθηκευτεί στον λογαριασμό ADLS Gen2 του οργανισμού. | |
Οι διαχειριστές fabric επιβλέπουν και παρακολουθούν τη δραστηριότητα στην πύλη Fabric. |
Βασικά σημεία
Ακολουθούν ορισμένα βασικά σημεία που πρέπει να τονιστούν σχετικά με το σενάριο προετοιμασίας δεδομένων για προχωρημένους.
Ροές δεδομένων
Μια ροή δεδομένων αποτελείται από μια συλλογή πινάκων (γνωστών επίσης ως οντότητες). Κάθε πίνακας ορίζεται από ένα ερώτημα, το οποίο περιέχει τα βήματα προετοιμασίας δεδομένων που απαιτούνται για τη φόρτωση του πίνακα με δεδομένα. Όλες οι εργασίες για τη δημιουργία μιας ροής δεδομένων εκτελούνται στο Power Query Online. Μπορείτε να δημιουργήσετε μια ροή δεδομένων σε πολλά προϊόντα, συμπεριλαμβανομένων των Power Apps, Dynamics 365 Customer Insights και Power BI.
Σημείωμα
Δεν μπορείτε να δημιουργήσετε ροές δεδομένων σε έναν προσωπικό χώρο εργασίας στην υπηρεσία Power BI.
Τύποι ροών δεδομένων
Η χρήση των κομποστοποιήσιμων δομικών στοιχείων είναι μια αρχή σχεδίασης που σας επιτρέπει να διαχειρίζεστε, να αναπτύσσετε και να ασφαλίζετε στοιχεία συστήματος και, στη συνέχεια, να τα χρησιμοποιείτε σε διάφορους συνδυασμούς. Η δημιουργία αρθρωτών, αυτόνομων ροών δεδομένων που αφορούν συγκεκριμένα έναν σκοπό είναι μια βέλτιστη πρακτική. Συμβάλλουν στην επίτευξη επαναχρησιμοποίησης δεδομένων και εταιρικής κλίμακας. Οι αρθρωτές ροές δεδομένων είναι επίσης πιο εύκολη στη διαχείριση και δοκιμή.
Στο διάγραμμα σεναρίου εμφανίζονται τρεις τύποι ροών δεδομένων: ροή δεδομένων προεργασίας, ροή δεδομένων μετασχηματισμού και τελική ροή δεδομένων.
Προεργασία ροής δεδομένων
Μια ροή δεδομένων προεργασίας (ορισμένες φορές ονομάζεται ροή δεδομένων εξαγωγής δεδομένων) αντιγράφει ανεπεξέργαστα δεδομένα όπως είναι από την προέλευση. Η εξαγωγή των ανεπεξέργαστων δεδομένων με ελάχιστο μετασχηματισμό σημαίνει ότι οι ροές δεδομένων μετασχηματισμού κατάντη (περιγράφονται στη συνέχεια) μπορούν να χρησιμοποιήσουν τη ροή δεδομένων προεργασίας ως προέλευση. Αυτή η αρθρωτή δομή είναι χρήσιμη όταν:
- Η πρόσβαση σε μια προέλευση δεδομένων περιορίζεται σε στενά χρονικά παράθυρα ή/και σε μερικούς χρήστες.
- Η χρονική συνέπεια είναι επιθυμητή για να διασφαλιστεί ότι όλες οι κατάντη ροές δεδομένων (και τα σχετικά σημασιολογικά μοντέλα) παρέχουν δεδομένα που έχουν εξαχθεί από την προέλευση δεδομένων ταυτόχρονα.
- Η μείωση του αριθμού ερωτημάτων που υποβάλλονται στην προέλευση δεδομένων είναι απαραίτητη λόγω περιορισμών του συστήματος προέλευσης ή της ικανότητάς του να υποστηρίζει ερωτήματα ανάλυσης.
- Ένα αντίγραφο των δεδομένων προέλευσης είναι χρήσιμο για διαδικασίες συμφιλίωσης και επαληθεύσεις ποιότητας δεδομένων.
Ροή δεδομένων μετασχηματισμού
Μια ροή δεδομένων μετασχηματισμού (ορισμένες φορές ονομάζεται εκκαθαρισμένη ροή δεδομένων) λαμβάνει τα δεδομένα της από συνδεδεμένους πίνακες που συνδέονται στη ροή δεδομένων προεργασίας. Η βέλτιστη πρακτική είναι να διαχωρίσετε τους μετασχηματισμούς από τη διαδικασία εξαγωγής δεδομένων.
Μια ροή δεδομένων μετασχηματισμού περιλαμβάνει όλα τα βήματα μετασχηματισμού που απαιτούνται για την προετοιμασία και την αναδόμηση των δεδομένων. Ωστόσο, εξακολουθεί να υπάρχει εστίαση στην επαναχρησιμοποίηση σε αυτό το επίπεδο για να διασφαλιστεί ότι η ροή δεδομένων είναι κατάλληλη για πολλαπλές περιπτώσεις χρήσης και σκοπούς.
Τελική ροή δεδομένων
Μια τελική ροή δεδομένων αντιπροσωπεύει την προετοιμασμένη έξοδο. Ενδέχεται να προκύψουν ορισμένοι πρόσθετοι μετασχηματισμοί με βάση την περίπτωση χρήσης και τον σκοπό. Για την ανάλυση, ένας πίνακας αστεροειδούς σχήματος (διάσταση ή γεγονός) είναι η προτιμώμενη σχεδίαση της τελικής ροής δεδομένων.
Οι υπολογισμένοι πίνακες είναι ορατοί στους δημιουργούς μοντέλων δεδομένων στους οποίους εκχωρείται ο ρόλος "Θεατής χώρου εργασίας" . Αυτός ο τύπος πίνακα περιγράφεται στο θέμα τύποι πινάκων ροής δεδομένων παρακάτω.
Σημείωμα
Οι λίμνες δεδομένων έχουν συχνά ζώνες, όπως χάλκινο, ασήμι και χρυσό. Οι τρεις τύποι ροών δεδομένων αντιπροσωπεύουν παρόμοιο μοτίβο σχεδίασης. Για να χρησιμοποιήσουμε τις καλύτερες δυνατές αποφάσεις αρχιτεκτονικής δεδομένων, σκέφτεστε ποιος θα διατηρήσει τα δεδομένα, την αναμενόμενη χρήση των δεδομένων και το επίπεδο δεξιοτήτων που απαιτείται από τους χρήστες που αποκτούν πρόσβαση στα δεδομένα.
Χώροι εργασίας για ροές δεδομένων
Εάν επρόκειτο να δημιουργήσετε όλες τις ροές δεδομένων σε έναν μόνο χώρο εργασίας, αυτό θα περιόριζε σημαντικά την έκταση της επαναχρησιμότητας. Η χρήση ενός μοναδικού χώρου εργασίας περιορίζει επίσης τις επιλογές ασφαλείας που είναι διαθέσιμες κατά την υποστήριξη πολλών τύπων χρηστών σε ομάδες ή/και για διαφορετικές περιπτώσεις χρήσης. Συνιστούμε τη χρήση πολλών χώρων εργασίας. Παρέχουν καλύτερη ευελιξία όταν θέλετε να υποστηρίξετε δημιουργούς αυτοεξυπηρέτησης από διάφορες περιοχές του οργανισμού.
Οι δύο τύποι χώρων εργασίας που εμφανίζονται στο διάγραμμα σεναρίου περιλαμβάνουν τα εξής:
- Χώρος εργασίας 1: Αποθηκεύει κεντρικά διαχειριζόμενες ροές δεδομένων (ορισμένες φορές αναφέρεται ως χώρος εργασίας παρασκηνίου). Περιέχει τις ροές δεδομένων προεργασίας και μετασχηματισμού, καθώς η διαχείρισή τους γίνεται από τα ίδια άτομα. Οι δημιουργοί ροών δεδομένων προέρχονται συχνά από μια κεντρική ομάδα, όπως το IT, το BI ή το Κέντρο αριστείας. Θα πρέπει να εκχωρούνται στον ρόλο διαχειριστή χώρου εργασίας, μέλους ή συμβάλλοντα.
- Χώρος εργασίας 2: Αποθηκεύει και παραδίδει την τελική έξοδο ροής δεδομένων στους καταναλωτές των δεδομένων (ορισμένες φορές αναφέρεται ως χώρος εργασίας χρήστη). Οι δημιουργοί σημασιολογικών μοντέλων είναι συχνά αναλυτές αυτοεξυπηρέτησης, χρήστες ισχύος ή μηχανικοί δεδομένων πολιτών. Θα πρέπει να εκχωρηθούν στον ρόλο θεατή χώρου εργασίας, επειδή χρειάζεται μόνο να καταναλώσουν το αποτέλεσμα της τελικής ροής δεδομένων. Για να υποστηρίξετε δημιουργούς σημασιολογικών μοντέλων από διάφορες περιοχές του οργανισμού, μπορείτε να δημιουργήσετε πολλούς χώρους εργασίας όπως αυτόν, με βάση τις ανάγκες χρήσης υποθέσεων και ασφάλειας.
Φιλοδώρημα
Συνιστούμε να εξετάσετε τρόπους υποστήριξης των δημιουργών σημασιολογικών μοντέλων, όπως περιγράφεται στο σενάριο χρήσης προετοιμασίας δεδομένων από τον χρήστη. Είναι σημαντικό να κατανοήσετε ότι οι δημιουργοί σημασιολογικών μοντέλων εξακολουθούν να μπορούν να χρησιμοποιήσουν τις πλήρεις δυνατότητες του Power Query στο Power BI Desktop. Μπορούν να επιλέξουν να προσθέσουν βήματα ερωτήματος για να μετασχηματίσουν περαιτέρω τα δεδομένα ροής δεδομένων ή να συγχωνεύσουν την έξοδο ροής δεδομένων με άλλες προελεύσεις.
Τύποι πινάκων ροής δεδομένων
Τρεις τύποι πινάκων ροής δεδομένων (γνωστοί και ως οντότητες) απεικονίζονται στο διάγραμμα σεναρίου.
- Τυπικός πίνακας: Υποβάλλει ερωτήματα σε μια εξωτερική προέλευση δεδομένων, όπως μια βάση δεδομένων. Στο διάγραμμα σεναρίου, οι τυπικοί πίνακες απεικονίζονται στη ροή δεδομένων προεργασίας.
- Συνδεδεμένος πίνακας: Αναφέρεται σε έναν πίνακα από μια άλλη ροή δεδομένων. Ένας συνδεδεμένος πίνακας δεν αναπαράγει τα δεδομένα. Αντίθετα, επιτρέπει την επαναχρησιμοποίηση ενός τυπικού πίνακα πολλές φορές για πολλαπλούς σκοπούς. Οι συνδεδεμένοι πίνακες δεν είναι ορατοί στους θεατές του χώρου εργασίας, καθώς λαμβάνουν δικαιώματα από την αρχική ροή δεδομένων. Στο διάγραμμα σεναρίου, οι συνδεδεμένοι πίνακες απεικονίζονται δύο φορές:
- Στη ροή δεδομένων μετασχηματισμού για πρόσβαση στα δεδομένα στη ροή δεδομένων προεργασίας.
- Στην τελική ροή δεδομένων για πρόσβαση στα δεδομένα στη ροή δεδομένων μετασχηματισμού.
- Υπολογισμένος πίνακας: Εκτελεί πρόσθετους υπολογισμούς χρησιμοποιώντας διαφορετική ροή δεδομένων ως προέλευση. Οι υπολογισμένοι πίνακες επιτρέπουν την προσαρμογή της εξόδου, όπως απαιτείται για μεμονωμένες περιπτώσεις χρήσης. Στο διάγραμμα σεναρίου, οι υπολογισμένοι πίνακες απεικονίζονται δύο φορές:
- Στη ροή δεδομένων μετασχηματισμού για την εκτέλεση κοινών μετασχηματισμών.
- Στην τελική ροή δεδομένων για την παράδοση εξόδου σε δημιουργούς σημασιολογικών μοντέλων. Δεδομένου ότι οι υπολογισμένοι πίνακες διατηρούν ξανά τα δεδομένα (μετά την ανανέωση της ροής δεδομένων), οι δημιουργούς μοντέλων δεδομένων μπορούν να έχουν πρόσβαση στους υπολογισμένους πίνακες στην τελική ροή δεδομένων. Σε αυτήν την περίπτωση, στους δημιουργούς μοντέλων δεδομένων θα πρέπει να εκχωρηθεί πρόσβαση με τον ρόλο θεατή χώρου εργασίας.
Σημείωμα
Υπάρχουν πολλές τεχνικές σχεδίασης, μοτίβα και βέλτιστες πρακτικές που μπορούν να μεταφέρουν ροές δεδομένων από την αυτοεξυπηρέτησης σε έτοιμες για επιχείρηση. Επίσης, οι ροές δεδομένων σε έναν χώρο εργασίας στον οποίο η λειτουργία άδειας χρήσης έχει οριστεί σε Premium ανά χρήστη ή Premium εκχωρημένους πόρους μπορούν να επωφεληθούν από προηγμένες δυνατότητες. Οι συνδεδεμένοι πίνακες και οι υπολογισμένοι πίνακες (γνωστοί και ως οντότητες) είναι δύο προηγμένες δυνατότητες που είναι απαραίτητες για την αύξηση της επαναχρησιμότητας των ροών δεδομένων.
Βελτιωμένη μηχανή υπολογιστικής λειτουργίας
Η βελτιωμένη μηχανή υπολογιστικής λειτουργίας είναι μια προηγμένη δυνατότητα διαθέσιμη με το Power BI Premium.
Σημαντικό
Κατά καιρούς αυτό το άρθρο αναφέρεται στο Power BI Premium ή στις συνδρομές εκχωρημένων πόρων του (P SKU). Να γνωρίζετε ότι η Microsoft ενοποιεί επί του παρόντος επιλογές αγοράς και αποσύρει το Power BI Premium ανά SKU εκχωρημένων πόρων. Οι νέοι και υπάρχοντες πελάτες θα πρέπει να εξετάσουν το ενδεχόμενο αγοράς συνδρομών εκχωρημένων πόρων Fabric (F SKU).
Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Σημαντικές ενημερώσεις που αφορούν την παραχώρηση αδειών χρήσης Power BI Premium και συνήθεις ερωτήσεις για το Power BI Premium.
Η βελτιωμένη μηχανή υπολογιστικής λειτουργίας βελτιώνει την απόδοση των συνδεδεμένων πινάκων (εντός του ίδιου χώρου εργασίας) που αναφέρουν (σύνδεση σε) τη ροή δεδομένων. Για να λάβετε το μέγιστο όφελος από τη βελτιωμένη μηχανή υπολογιστικής λειτουργίας:
- Διαιρέστε τις ροές δεδομένων προεργασίας και μετασχηματισμού.
- Χρησιμοποιήστε τον ίδιο χώρο εργασίας για να αποθηκεύσετε τις ροές δεδομένων προεργασίας και μετασχηματισμού.
- Εφαρμόστε σύνθετες λειτουργίες που μπορούν να υποβάλουν ερωτήματα αναδίπλωση νωρίς στα βήματα ερωτήματος. Η ιεράρχηση των λειτουργιών με δυνατότητα αναδίπλωσης μπορεί να βοηθήσει στην επίτευξη των καλύτερων επιδόσεων ανανέωσης.
- Χρησιμοποιήστε την επαυξητική ανανέωση για να μειώσετε τη διάρκεια ανανέωσης και την κατανάλωση πόρων.
- Εκτελέστε τις δοκιμές νωρίς και συχνά κατά τη διάρκεια της φάσης ανάπτυξης.
Ανανέωση ροής δεδομένων και σημασιολογικού μοντέλου
Μια ροή δεδομένων είναι μια προέλευση δεδομένων για σημασιολογικά μοντέλα. Στις περισσότερες περιπτώσεις, εμπλέκονται πολλά χρονοδιαγράμματα ανανέωσης δεδομένων: ένα για κάθε ροή δεδομένων και ένα για κάθε μοντέλο σημασιολογίας. Εναλλακτικά, μπορείτε να χρησιμοποιήσετε το DirectQuery από το μοντέλο σημασιολογίας στη ροή δεδομένων, το οποίο απαιτεί το Power BI Premium και τη βελτιωμένη μηχανή υπολογιστικής λειτουργίας (δεν απεικονίζεται στο διάγραμμα σεναρίου).
Azure Data Lake Storage Gen2
Ένας λογαριασμός ADLS Gen2 είναι ένας συγκεκριμένος τύπος λογαριασμού υπηρεσίας αποθήκευσης Azure που έχει ενεργοποιημένο τον ιεραρχικό χώρο ονομάτων . Το ADLS Gen2 έχει πλεονεκτήματα επιδόσεων, διαχείρισης και ασφάλειας για τη λειτουργία φόρτων εργασίας ανάλυσης. Από προεπιλογή, οι ροές δεδομένων Power BI χρησιμοποιούν εσωτερικό χώρο αποθήκευσης, ο οποίος είναι ένας ενσωματωμένος λογαριασμός λίμνης δεδομένων τον οποίο διαχειρίζεται η υπηρεσία Power BI. Προαιρετικά, οι οργανισμοί μπορούν να μεταφέρουν τη δική τους λίμνη δεδομένων μέσω σύνδεσης σε έναν λογαριασμό ADLS Gen2 στον οργανισμό τους.
Ακολουθούν ορισμένα πλεονεκτήματα της χρήσης της δικής σας λίμνης δεδομένων:
- Οι χρήστες (ή οι διαδικασίες) έχουν απευθείας πρόσβαση στα δεδομένα ροής δεδομένων που είναι αποθηκευμένα στη λίμνη δεδομένων. Αυτό είναι χρήσιμο όταν πραγματοποιείται εκ νέου χρήση της ροής δεδομένων πέρα από το Power BI. Για παράδειγμα, το Azure Data Factory μπορεί να έχει πρόσβαση στα δεδομένα ροής δεδομένων.
- Άλλα εργαλεία ή συστήματα μπορούν να διαχειριστούν τα δεδομένα στη λίμνη δεδομένων. Σε αυτήν την περίπτωση, το Power BI θα μπορούσε να καταναλώσει τα δεδομένα αντί να τα διαχειριστεί (δεν απεικονίζονται στο διάγραμμα σεναρίου).
Όταν χρησιμοποιείτε συνδεδεμένους πίνακες ή υπολογισμένους πίνακες, βεβαιωθείτε ότι κάθε χώρος εργασίας έχει αντιστοιχιστεί στον ίδιο λογαριασμό χώρου αποθήκευσης ADLS Gen2.
Σημείωμα
Τα δεδομένα ροής δεδομένων στο ADLS Gen2 αποθηκεύονται εντός ενός κοντέινερ ειδικά για το Power BI. Αυτό το κοντέινερ απεικονίζεται στο διάγραμμα σεναρίου χρήσης προετοιμασίας δεδομένων αυτοεξυπηρέτησης .
Ρυθμίσεις πύλης διαχείρισης
Υπάρχουν δύο σημαντικές ρυθμίσεις για διαχείριση στην πύλη διαχείρισης:
- Συνδέσεις Azure: Η ενότητα συνδέσεων Azure της πύλης διαχείρισης περιλαμβάνει μια ρύθμιση για τη ρύθμιση μιας σύνδεσης σε έναν λογαριασμό ADLS Gen2. Αυτή η ρύθμιση επιτρέπει σε έναν διαχειριστή Power BI να μεταφέρει τη δική σας λίμνη δεδομένων σε ροές δεδομένων. Αφού ρυθμιστούν οι παράμετροι, οι χώροι εργασίας μπορούν να χρησιμοποιήσουν αυτόν τον λογαριασμό λίμνης δεδομένων για χώρο αποθήκευσης.
- Χώρος αποθήκευσης σε επίπεδο χώρου εργασίας: Ένας διαχειριστής του Power BI μπορεί να ορίσει δικαιώματα αποθήκευσης σε επίπεδο χώρου εργασίας. Όταν είναι ενεργοποιημένη, η ρύθμιση επιτρέπει στους διαχειριστές χώρου εργασίας να χρησιμοποιούν διαφορετικό λογαριασμό χώρου αποθήκευσης με αυτόν που ορίζεται σε επίπεδο μισθωτή. Η ενεργοποίηση αυτής της ρύθμισης είναι χρήσιμη για αποκεντρωμένες επιχειρηματικές μονάδες που διαχειρίζονται τη δική τους λίμνη δεδομένων στο Azure.
Ρύθμιση πύλης
Συνήθως, απαιτείται μια πύλη δεδομένων εσωτερικής εγκατάστασης για τη σύνδεση σε προελεύσεις δεδομένων που βρίσκονται εντός ενός ιδιωτικού εταιρικού δικτύου ή εικονικού δικτύου.
Μια πύλη δεδομένων απαιτείται όταν:
- Σύνταξη μιας ροής δεδομένων στο Power Query Online που συνδέεται σε ιδιωτικά εταιρικά δεδομένα.
- Ανανέωση μιας ροής δεδομένων που συνδέεται σε δεδομένα ιδιωτικού οργανισμού.
Φιλοδώρημα
Οι ροές δεδομένων απαιτούν μια κεντρική πύλη δεδομένων σε τυπική λειτουργία. Μια πύλη σε προσωπική λειτουργία δεν υποστηρίζεται κατά την εργασία με ροές δεδομένων.
Εποπτεία συστήματος
Το αρχείο καταγραφής δραστηριότητας καταγράφει τις δραστηριότητες των χρηστών που πραγματοποιούνται στην υπηρεσία Power BI. Οι διαχειριστές του Power BI μπορούν να χρησιμοποιήσουν τα δεδομένα αρχείου καταγραφής δραστηριότητας που συλλέγονται για να εκτελέσουν έλεγχο για να τους βοηθήσουν να κατανοήσουν τα μοτίβα χρήσης και την υιοθέτηση. Το αρχείο καταγραφής δραστηριότητας είναι επίσης πολύτιμο για την υποστήριξη των προσπαθειών διαχείρισης, των ελέγχων ασφαλείας και των απαιτήσεων συμμόρφωσης. Στο σενάριο προετοιμασίας δεδομένων για προχωρημένους, τα δεδομένα αρχείου καταγραφής δραστηριότητας είναι χρήσιμα για την παρακολούθηση της διαχείρισης και χρήσης των ροών δεδομένων.
Σχετικό περιεχόμενο
Για άλλα χρήσιμα σενάρια που θα σας βοηθήσουν με αποφάσεις υλοποίησης Power BI, ανατρέξτε στο άρθρο Σενάρια χρήσης του Power BI.