Κατανόηση και βελτιστοποίηση της ανανέωσης ροών δεδομένων
Οι ροές δεδομένων Power BI σάς επιτρέπουν να συνδέεστε, να μετασχηματίζετε, να συνδυάζετε και να διανέμετε δεδομένα για μεταγενέστερη ανάλυση. Ένα βασικό στοιχείο στις ροές δεδομένων είναι η διαδικασία ανανέωσης, η οποία εφαρμόζει τα βήματα μετασχηματισμού που έχετε συντάξετε στις ροές δεδομένων και ενημερώνει τα δεδομένα στα ίδια τα στοιχεία.
Για να κατανοήσετε τους χρόνους εκτέλεσης, τις επιδόσεις και εάν αξιοποιήσετε στο έπακρο τη ροή δεδομένων σας, μπορείτε να κάνετε λήψη του ιστορικού ανανέωσης μετά την ανανέωση μιας ροής δεδομένων.
Κατανόηση ανανεώσεων
Υπάρχουν δύο τύποι ανανεώσεων που ισχύουν για τις ροές δεδομένων:
Πλήρης, το οποίο εκτελεί πλήρη εκκαθάριση και επαναφόρτωση των δεδομένων σας.
Επαυξητική (μόνο Premium), η οποία επεξεργάζεται ένα υποσύνολο των δεδομένων σας βάσει κανόνων βάσει χρόνου, εκφρασμένων ως φίλτρου, που ρυθμίζετε. Το φίλτρο στη στήλη ημερομηνιών διαμερίζει δυναμικά τα δεδομένα σε περιοχές στον Υπηρεσία Power BI. Αφού ρυθμίσετε τις παραμέτρους της επαυξητικής ανανέωσης, η ροή δεδομένων αλλάζει αυτόματα το ερώτημά σας για να συμπεριλάβει φιλτράρισμα κατά ημερομηνία. Μπορείτε να επεξεργαστείτε το ερώτημα που δημιουργείται αυτόματα, χρησιμοποιώντας την Προηγμένο πρόγραμμα επεξεργασίας στο Power Query για να βελτιστοποιήσετε ή να προσαρμόσετε την ανανέωσή σας. Εάν μεταφέρετε το δικό σας Azure Data Lake Υπηρεσία αποθήκευσης, μπορείτε να δείτε αναλυτές χρόνου των δεδομένων σας με βάση την πολιτική ανανέωσης που έχετε ορίσει.
Σημείωμα
Για να μάθετε περισσότερα σχετικά με την επαυξητική ανανέωση και τον τρόπο λειτουργίας της, ανατρέξτε στο θέμα Χρήση επαυξητικής ανανέωσης με ροές δεδομένων.
Η επαυξητική ανανέωση επιτρέπει μεγάλες ροές δεδομένων στο Power BI με τα εξής πλεονεκτήματα:
Οι ανανεώσεις είναι ταχύτερες μετά την πρώτη ανανέωση, εξαιτίας των ακόλουθων στοιχείων:
- Το Power BI ανανεώνει τα τελευταία N διαμερίσματα που καθορίζονται από τον χρήστη (όπου το διαμέρισμα είναι ημέρα/εβδομάδα/μήνας και ούτω καθεξής) ή
- Το Power BI ανανεώνει μόνο τα δεδομένα που χρειάζεται να ανανεωθούν. Για παράδειγμα, ανανέωση μόνο των τελευταίων πέντε ημερών ενός μοντέλου σημασιολογίας 10 ετών.
- Το Power BI ανανεώνει μόνο τα δεδομένα που έχουν αλλάξει, με την προϋπόθεση ότι καθορίζετε τη στήλη που θέλετε να ελέγξετε για αλλαγές.
Οι ανανεώσεις είναι πιο αξιόπιστες - δεν είναι πλέον απαραίτητο να διατηρείτε μακροχρόνιες συνδέσεις σε συστήματα προσωρινής προέλευσης.
Η κατανάλωση πόρων μειώνεται - λιγότερα δεδομένα για ανανέωση μειώνει τη συνολική κατανάλωση μνήμης και άλλων πόρων.
Όποτε είναι δυνατό, το Power BI χρησιμοποιεί παράλληλη επεξεργασία σε διαμερίσματα, το οποίο μπορεί να οδηγήσει σε ταχύτερες ανανεώσεις.
Σε οποιοδήποτε από αυτά τα σενάρια ανανέωσης, εάν αποτύχει η ανανέωση, τα δεδομένα δεν ενημερώνονται. Τα δεδομένα σας μπορεί να είναι παλιά μέχρι να ολοκληρωθεί η πιο πρόσφατη ανανέωση ή μπορείτε να τα ανανεώσετε με μη αυτόματο τρόπο και, στη συνέχεια, να ολοκληρωθούν χωρίς σφάλμα. Η ανανέωση πραγματοποιείται σε ένα διαμέρισμα ή μια οντότητα, επομένως εάν αποτύχει μια επαυξητική ανανέωση ή μια οντότητα παρουσιάζει σφάλμα, τότε δεν πραγματοποιείται ολόκληρη η συναλλαγή ανανέωσης. Όπως είπε ένας άλλος τρόπος, εάν ένα διαμέρισμα (πολιτική επαυξητικής ανανέωσης) ή μια οντότητα αποτύχει για μια ροή δεδομένων, ολόκληρη η λειτουργία ανανέωσης αποτυγχάνει και δεν ενημερώνονται δεδομένα.
Κατανόηση και βελτιστοποίηση ανανεώσεων
Για να κατανοήσετε καλύτερα τον τρόπο που εκτελείται μια λειτουργία ανανέωσης ροής δεδομένων, εξετάστε το Ιστορικό ανανέωσης για τη ροή δεδομένων, μεταβαίνοντας σε μία από τις ροές δεδομένων σας. Επιλέξτε Περισσότερες επιλογές (...) για τη ροή δεδομένων. Στη συνέχεια, επιλέξτε Ρυθμίσεις > Ιστορικό ανανέωσης. Μπορείτε επίσης να επιλέξετε τη ροή δεδομένων στον χώρο εργασίας. Στη συνέχεια, επιλέξτε Περισσότερες επιλογές (...) > Ιστορικό ανανέωσης.
Το Ιστορικό ανανέωσης παρέχει μια επισκόπηση των ανανεώσεων, συμπεριλαμβανομένου του τύπου – κατ' απαίτηση ή προγραμματισμένο, της διάρκειας και της κατάστασης εκτέλεσης. Για να δείτε λεπτομέρειες με τη μορφή ενός αρχείου CSV, επιλέξτε το εικονίδιο λήψης στο δεξί άκρο της γραμμής περιγραφής ανανέωσης. Το CSV που λάβετε περιλαμβάνει τα χαρακτηριστικά που περιγράφονται στον παρακάτω πίνακα. Οι ανανεώσεις Premium παρέχουν περισσότερες πληροφορίες με βάση τις επιπλέον δυνατότητες υπολογισμού και ροών δεδομένων, σε σύγκριση με τις ροές δεδομένων που βασίζονται σε Pro και βρίσκονται σε κοινόχρηστους εκχωρημένους πόρους. Ως εκ τούτου, ορισμένα από τα παρακάτω μετρικά είναι διαθέσιμα μόνο σε Premium.
Στοιχείο | Περιγραφή | Pro | Premium |
---|---|---|---|
Ζητήθηκε στις | Έχει προγραμματιστεί ανανέωση χρόνου ή έγινε κλικ στην επιλογή ανανέωση τώρα, στην τοπική ώρα. | ✔ | ✔ |
Όνομα ροής δεδομένων | Το όνομα της ροής δεδομένων σας. | ✔ | ✔ |
Κατάσταση ανανέωσης ροής δεδομένων | Οι καταστάσεις Ολοκληρώθηκε, Αποτυχία ή Παραλείφθηκε (για μια οντότητα) είναι πιθανές καταστάσεις. Περιπτώσεις χρήσης όπως οι Συνδεδεμένες οντότητες είναι οι λόγοι για τους οποίους μπορεί να παραληφθεί κάποια. | ✔ | ✔ |
Όνομα οντότητας | Όνομα πίνακα. | ✔ | ✔ |
Όνομα διαμερίσματος | Αυτό το στοιχείο εξαρτάται από το αν η ροή δεδομένων είναι premium ή όχι και εάν η έκδοση Pro εμφανίζεται ως NA επειδή δεν υποστηρίζει επαυξητικές ανανεώσεις. Το Premium εμφανίζει είτε FullRefreshPolicyPartition είτε IncrementalRefreshPolicyPartition-[DateRange]. | ✔ | |
Κατάσταση ανανέωσης | Κατάσταση ανανέωσης της μεμονωμένης οντότητας ή διαμερίσματος, η οποία παρέχει την κατάσταση για το συγκεκριμένο χρονικό τμήμα δεδομένων που ανανεώνεται. | ✔ | ✔ |
Ώρα έναρξης | Στην έκδοση Premium, αυτό το στοιχείο είναι η ώρα που η ροή δεδομένων τέθηκε σε ουρά για επεξεργασία για την οντότητα ή το διαμέρισμα. Αυτή η ώρα μπορεί να διαφέρει εάν οι ροές δεδομένων έχουν εξαρτήσεις και πρέπει να περιμένουν μέχρι να ξεκινήσει η επεξεργασία του συνόλου αποτελεσμάτων μιας ροής δεδομένων upstream. | ✔ | ✔ |
Ώρα λήξης | Η ώρα λήξης είναι η ώρα που ολοκληρώθηκε η οντότητα ή το διαμέρισμα ροής δεδομένων, εάν υπάρχει. | ✔ | ✔ |
Διάρκεια | Ο συνολικός χρόνος που παρήλθε για την ανανέωση της ροής δεδομένων, εκφρασμένος σε ΩΩ:ΛΛ:ΔΔ. | ✔ | ✔ |
Επεξεργασία γραμμών | Για μια δεδομένη οντότητα ή διαμέρισμα, ο αριθμός των γραμμών που σαρώθηκαν ή συντάχθηκαν από τον μηχανισμό ροών δεδομένων. Αυτό το στοιχείο μπορεί να μην περιέχει πάντα δεδομένα με βάση τη λειτουργία που εκτελέσατε. Τα δεδομένα μπορεί να παραλειφθούν όταν η μηχανή υπολογιστικής λειτουργίας δεν χρησιμοποιείται ή όταν χρησιμοποιείτε μια πύλη καθώς τα δεδομένα επεξεργάζονται εκεί. | ✔ | |
Επεξεργασία byte | Για μια δεδομένη οντότητα ή διαμέρισμα, δεδομένα που έχουν συνταχθεί από τον μηχανισμό ροών δεδομένων, εκφρασμένα σε byte. Όταν χρησιμοποιείτε μια πύλη σε αυτήν τη συγκεκριμένη ροή δεδομένων, αυτές οι πληροφορίες δεν παρέχονται. |
✔ | |
Μέγιστη δέσμευση (KB) | Η Μέγιστη δέσμευση είναι η μέγιστη μνήμη δέσμευσης που είναι χρήσιμη για τη διάγνωση αποτυχιών εκτός μνήμης όταν το ερώτημα M δεν έχει βελτιστοποιηθεί. Όταν χρησιμοποιείτε μια πύλη σε αυτήν τη συγκεκριμένη ροή δεδομένων, αυτές οι πληροφορίες δεν παρέχονται. |
✔ | |
Χρόνος επεξεργαστή | Για μια δεδομένη οντότητα ή διαμέρισμα, τον χρόνο, εκφρασμένο σε ΩΩ:ΛΛ:ΔΔ, τα οποία καταναλώνει ο μηχανισμός ροών δεδομένων για την εκτέλεση μετασχηματισμών. Όταν χρησιμοποιείτε μια πύλη σε αυτήν τη συγκεκριμένη ροή δεδομένων, αυτές οι πληροφορίες δεν παρέχονται. |
✔ | |
Χρόνος αναμονής | Για μια δεδομένη οντότητα ή διαμέρισμα, τον χρόνο που καταναλώνει μια οντότητα σε κατάσταση αναμονής, με βάση τον φόρτο εργασίας στους Premium εκχωρημένους πόρους. | ✔ | |
Μηχανή υπολογιστικής λειτουργίας | Για μια δεδομένη οντότητα ή διαμέρισμα, λεπτομέρειες σχετικά με τον τρόπο με τον οποίο η λειτουργία ανανέωσης χρησιμοποιεί τη μηχανή υπολογιστικής λειτουργίας. Οι τιμές είναι: -NA -Διπλωμένο -Προσωρινής αποθήκευσης - Αποθηκευμένο στο cache + Αναδιπλωμένο Αυτά τα στοιχεία περιγράφονται με περισσότερες λεπτομέρειες παρακάτω σε αυτό το άρθρο. |
✔ | |
Error | Εάν υπάρχει, το λεπτομερές μήνυμα σφάλματος περιγράφεται ανά οντότητα ή διαμέρισμα. | ✔ | ✔ |
Οδηγίες για την ανανέωση ροής δεδομένων
Τα στατιστικά στοιχεία ανανέωσης παρέχουν πολύτιμες πληροφορίες που μπορείτε να χρησιμοποιήσετε για να βελτιστοποιήσετε και επιταχύνετε τις επιδόσεις των ροών δεδομένων σας. Στις παρακάτω ενότητες, περιγράφουμε ορισμένα σενάρια, τι πρέπει να προσέξετε και πώς να τα βελτιστοποιήσετε με βάση τις παρεχόμενες πληροφορίες.
Ενορχήστρωση
Η χρήση ροών δεδομένων στον ίδιο χώρο εργασίας επιτρέπει απλή ενορχήστρωση. Για παράδειγμα, μπορεί να έχετε ροές δεδομένων A, B και C σε έναν μοναδικό χώρο εργασίας και να συνδέονται σε αλυσίδα όπως το A > B > C. Εάν ανανεώσετε την προέλευση (A), οι κατάντη οντότητες ανανεώνονται επίσης. Ωστόσο, εάν ανανεώσετε τη C, τότε πρέπει να ανανεώσετε τους άλλους ανεξάρτητα. Επίσης, εάν προσθέσετε μια νέα προέλευση δεδομένων στη ροή δεδομένων B (η οποία δεν περιλαμβάνεται στο A), τα δεδομένα δεν ανανεώνονται ως μέρος της ενορχήστρωσης.
Μπορεί να θέλετε να ενώσετε στοιχεία που δεν ταιριάζουν με τη διαχειριζόμενη ενορχήστρωση που εκτελεί το Power BI. Σε αυτά τα σενάρια, μπορείτε να χρησιμοποιήσετε τα API ή/και να χρησιμοποιήσετε το Power Automate. Μπορείτε να ανατρέξετε στην τεκμηρίωση API και στη δέσμη ενεργειών PowerShell για προγραμματισμένη ανανέωση. Υπάρχει μια σύνδεση Power Automate που επιτρέπει την πραγματοποίηση αυτής της διαδικασίας χωρίς τη σύνταξη κώδικα. Μπορείτε να δείτε λεπτομερή δείγματα, με συγκεκριμένες οδηγίες για διαδοχικές ανανεώσεις.
Εποπτεία
Χρησιμοποιώντας τα στατιστικά στοιχεία βελτιωμένης ανανέωσης που περιγράφονται παραπάνω σε αυτό το άρθρο, μπορείτε να λάβετε λεπτομερείς πληροφορίες ανανέωσης ανά ροή δεδομένων. Ωστόσο, αν θέλετε να δείτε ροές δεδομένων με επισκόπηση ανανεώσεων σε ολόκληρο τον μισθωτή ή σε όλο τον χώρο εργασίας, ίσως για να δημιουργήσετε έναν πίνακα εργαλείων παρακολούθησης, μπορείτε να χρησιμοποιήσετε τα πρότυπα API ή PowerAutomate. Παρομοίως, για περιπτώσεις χρήσης όπως η αποστολή απλών ή σύνθετων ειδοποιήσεων, μπορείτε να χρησιμοποιήσετε τη σύνδεση PowerAutomate ή να δημιουργήσετε τη δική σας προσαρμοσμένη εφαρμογή, χρησιμοποιώντας τα API.
Σφάλματα χρονικού ορίου
Η βελτιστοποίηση του χρόνου που απαιτείται για την εκτέλεση σεναρίων εξαγωγής, μετασχηματισμού και φόρτωσης (ETL) είναι ιδανική. Στο Power BI ισχύουν οι ακόλουθες περιπτώσεις:
- Ορισμένες συνδέσεις έχουν ρητές ρυθμίσεις λήξης χρονικού ορίου που μπορείτε να ρυθμίσετε. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Σύνδεση ors στο Power Query.
- Οι ροές δεδομένων Power BI, χρησιμοποιώντας το Power BI Pro, μπορούν επίσης να αντιμετωπίσουν χρονικά όρια για ερωτήματα μεγάλης διάρκειας σε μια οντότητα ή ροές δεδομένων. Αυτός ο περιορισμός δεν υπάρχει στους χώρους εργασίας Power BI Premium.
Οδηγίες λήξης χρονικού ορίου
Τα όρια χρονικού ορίου για τις ροές δεδομένων Power BI Pro είναι τα εξής:
- Δύο ώρες στο επίπεδο μεμονωμένης οντότητας.
- Τρεις ώρες σε ολόκληρο το επίπεδο ροής δεδομένων.
Για παράδειγμα, εάν έχετε μια ροή δεδομένων με τρεις πίνακες, κανένας μεμονωμένος πίνακας δεν μπορεί να χρειαστεί περισσότερο από δύο ώρες και ολόκληρη η ροή δεδομένων ορίου εάν η διάρκεια υπερβεί τις τρεις ώρες.
Εάν αντιμετωπίζετε χρονικά όρια, εξετάστε το ενδεχόμενο να βελτιστοποιήσετε τα ερωτήματα ροής δεδομένων και να χρησιμοποιήσετε την αναδίπλωση ερωτήματος στα συστήματα προέλευσής σας.
Ξεχωριστά, εξετάστε το ενδεχόμενο αναβάθμισης σε Premium ανά χρήστη, το οποίο δεν υπόκειται σε αυτά τα χρονικά όριο και προσφέρει αυξημένη απόδοση λόγω πολλών δυνατοτήτων του Power BI Premium ανά χρήστη.
Μεγάλες διάρκειες
Οι σύνθετες ή μεγάλες ροές δεδομένων μπορεί να χρειαστούν περισσότερο χρόνο για να ανανεωθούν, όπως και οι ροές δεδομένων που δεν έχουν βελτιστοποιηθεί επαρκώς. Οι παρακάτω ενότητες παρέχουν οδηγίες σχετικά με τον τρόπο άμβλυνσης των μεγάλων διαρκειών ανανέωσης.
Οδηγίες για μεγάλες διάρκειες ανανέωσης
Το πρώτο βήμα για τη βελτίωση της μεγάλης διάρκειας ανανέωσης για ροές δεδομένων είναι η δημιουργία ροών δεδομένων σύμφωνα με τις βέλτιστες πρακτικές. Τα αξιοσημείωτα μοτίβα περιλαμβάνουν τα εξής:
- Χρησιμοποιήστε συνδεδεμένες οντότητες για δεδομένα που μπορούν να χρησιμοποιηθούν αργότερα σε άλλους μετασχηματισμούς.
- Χρησιμοποιήστε υπολογισμένες οντότητες για να αποθηκεύσετε στο cache δεδομένα, μειώνοντας τη φόρτωση δεδομένων και την επιβάρυνση πρόσληψης δεδομένων στα συστήματα προέλευσης.
- Διαιρέστε δεδομένα σε ροές δεδομένων προεργασίας και ροές δεδομένων μετασχηματισμού, διαχωρίζοντας το ETL σε διαφορετικές ροές δεδομένων.
- Βελτιστοποιήστε τις λειτουργίες πίνακα επέκτασης.
- Ακολουθήστε τις οδηγίες για σύνθετες ροές δεδομένων.
Στη συνέχεια, μπορεί να σας βοηθήσει να αξιολογήσετε εάν μπορείτε να χρησιμοποιήσετε επαυξητική ανανέωση.
Η χρήση επαυξητικής ανανέωσης μπορεί να βελτιώσει τις επιδόσεις. Είναι σημαντικό τα φίλτρα διαμερίσματος να προωθούνται στο σύστημα προέλευσης κατά την υποβολή ερωτημάτων για λειτουργίες ανανέωσης. Για την προώθηση του φιλτραρίσματος η προέλευση δεδομένων θα πρέπει να υποστηρίζει αναδίπλωση ερωτήματος ή μπορείτε να εκφράσετε επιχειρηματική λογική μέσω μιας συνάρτησης ή άλλων μέσων που μπορούν να βοηθήσουν το Power Query να εξαλείψει και να φιλτράρει αρχεία ή φακέλους. Οι περισσότερες προελεύσεις δεδομένων που υποστηρίζουν ερωτήματα SQL υποστηρίζουν αναδίπλωση ερωτήματος και ορισμένες τροφοδοσίες OData μπορούν επίσης να υποστηρίξουν φιλτράρισμα.
Ωστόσο, προελεύσεις δεδομένων όπως επίπεδα αρχείων, αντικείμενα blob και API συνήθως δεν υποστηρίζουν φιλτράρισμα. Σε περιπτώσεις όπου το παρασκήνιο της προέλευσης δεδομένων δεν υποστηρίζει το φίλτρο, δεν είναι δυνατό να προωθηθεί. Σε αυτές τις περιπτώσεις, ο μηχανισμός συνδυασμού δεδομένων αντισταθμίζει και εφαρμόζει τοπικά το φίλτρο, το οποίο μπορεί να απαιτεί την ανάκτηση του πλήρους μοντέλου σημασιολογίας από την προέλευση δεδομένων. Αυτή η λειτουργία μπορεί να προκαλέσει την αργή επαυξητική ανανέωση και η διαδικασία μπορεί να εξαντλήσει τους πόρους είτε στην Υπηρεσία Power BI είτε στην πύλη δεδομένων εσωτερικής εγκατάστασης, εάν χρησιμοποιηθεί.
Δεδομένου ότι υπάρχουν διάφορα επίπεδα υποστήριξης αναδίπλωσης ερωτήματος για κάθε προέλευση δεδομένων, θα πρέπει να εκτελέσετε επαλήθευση για να εξασφαλίσετε ότι η λογική φιλτραρίσματος περιλαμβάνεται στα ερωτήματα προέλευσης. Για να γίνει αυτό πιο εύκολο, το Power BI επιχειρεί να εκτελέσει αυτήν την επαλήθευση για εσάς, με δείκτες αναδίπλωσης βήματος για το Power Query Online. Πολλές από αυτές τις βελτιστοποιήσεις είναι εμπειρίες χρόνου σχεδίασης, αλλά μετά την ανανέωση, έχετε τη δυνατότητα να αναλύσετε και να βελτιστοποιήσετε τις επιδόσεις ανανέωσής σας.
Τέλος, εξετάστε το ενδεχόμενο να βελτιστοποιήσετε το περιβάλλον σας. Μπορείτε να βελτιστοποιήσετε το περιβάλλον Power BI, αυξάνοντας τους εκχωρημένους πόρους σας, αλλάζοντας σωστά τις πύλες δεδομένων και μειώνοντας τον λανθάνοντα χρόνου δικτύου με τις ακόλουθες βελτιστοποιήσεις:
Όταν χρησιμοποιείτε εκχωρημένους πόρους που είναι διαθέσιμοι με το Power BI Premium ή το Premium ανά χρήστη, μπορείτε να αυξήσετε την απόδοση αυξάνοντας την παρουσία Premium ή εκχωρώντας το περιεχόμενο σε διαφορετικό σύνολο εκχωρημένων πόρων.
Μια πύλη απαιτείται όποτε το Power BI χρειάζεται να αποκτήσει πρόσβαση σε δεδομένα που δεν είναι απευθείας διαθέσιμα μέσω του Internet. Μπορείτε να εγκαταστήσετε την πύλη δεδομένων εσωτερικής εγκατάστασης σε έναν διακομιστή εσωτερικής εγκατάστασης ή σε μια εικονική μηχανή.
- Για να κατανοήσετε τους φόρτους εργασίας πύλης και τις προτάσεις μεγέθους, ανατρέξτε στο θέμα Αλλαγή μεγέθους πύλης δεδομένων εσωτερικής εγκατάστασης.
- Αξιολογεί επίσης την εισαγωγή των δεδομένων πρώτα σε μια ροή δεδομένων προεργασίας και την αναφορά τους στα κατάντη χρησιμοποιώντας συνδεδεμένες και υπολογισμένες οντότητες.
Ο λανθάνων χρόνος δικτύου μπορεί να επηρεάσει την απόδοση της ανανέωσης, αυξάνοντας τον χρόνο που απαιτείται για να φτάσουν οι αιτήσεις στα Υπηρεσία Power BI και για την παράδοση των αποκρίσεων. Οι μισθωτές στο Power BI αντιστοιχίζονται σε μια συγκεκριμένη περιοχή. Για να προσδιορίσετε πού βρίσκεται ο μισθωτής σας, ανατρέξτε στο θέμα Εύρεση της προεπιλεγμένης περιοχής για τον οργανισμό σας. Όταν οι χρήστες από έναν μισθωτή αποκτήσουν πρόσβαση στις Υπηρεσία Power BI, οι αιτήσεις τους δρομολογείται πάντα σε αυτήν την περιοχή. Καθώς οι αιτήσεις φτάνουν στο Υπηρεσία Power BI, η υπηρεσία ενδέχεται να στείλει επιπλέον αιτήσεις, για παράδειγμα, στην υποκείμενη προέλευση δεδομένων ή σε μια πύλη δεδομένων, οι οποίες υπόκεινται επίσης σε λανθάνοντα χρόνο δικτύου.
- Εργαλεία όπως το Azure Speed Test παρέχουν μια ένδειξη του λανθάνοντος χρόνου δικτύου μεταξύ του προγράμματος-πελάτη και της περιοχής Azure. Γενικά, για να ελαχιστοποιήσετε τις επιπτώσεις του λανθάνοντος χρόνου δικτύου, προσπαθήστε να διατηρείτε τις προελεύσεις δεδομένων, τις πύλες και το σύμπλεγμα Power BI όσο το δυνατόν πιο κοντά. Η διαμονή στην ίδια περιοχή είναι προτιμότερη. Εάν έχετε πρόβλημα με τον λανθάνοντα χρόνου δικτύου, δοκιμάστε να εντοπίσετε τις πύλες και τις προελεύσεις δεδομένων πιο κοντά στο σύμπλεγμα Power BI σας, τοποθετώντας τις σε εικονικές μηχανές που φιλοξενούνται στο cloud.
Υψηλός χρόνος επεξεργαστή
Εάν βλέπετε υψηλό χρόνο επεξεργαστή, πιθανώς έχετε δαπανηρούς μετασχηματισμούς που δεν αναδιπλώνονται. Ο υψηλός χρόνος επεξεργαστή οφείλεται είτε στον αριθμό των εφαρμοσμένων βημάτων που έχετε είτε στον τύπο μετασχηματισμών που πραγματοποιείτε. Κάθε μία από αυτές τις δυνατότητες μπορεί να οδηγήσει σε υψηλότερους χρόνους ανανέωσης.
Οδηγίες για τον υψηλό χρόνο επεξεργαστή
Υπάρχουν δύο επιλογές για τη βελτιστοποίηση του χρόνου επεξεργαστή.
Πρώτα, χρησιμοποιήστε αναδίπλωση ερωτήματος μέσα στην ίδια την προέλευση δεδομένων, το οποίο θα πρέπει να μειώσει το φόρτο απευθείας στη μηχανή υπολογιστικής λειτουργίας ροής δεδομένων. Η αναδίπλωση ερωτήματος μέσα στην προέλευση δεδομένων επιτρέπει στο σύστημα προέλευσης να εκτελέσει το μεγαλύτερο μέρος της εργασίας. Στη συνέχεια, η ροή δεδομένων μπορεί να περάσει από ερωτήματα στην εγγενή γλώσσα της προέλευσης, αντί να χρειάζεται να εκτελέσει όλους τους υπολογισμούς στη μνήμη μετά το αρχικό ερώτημα.
Δεν μπορούν όλες οι προελεύσεις δεδομένων να εκτελέσουν αναδίπλωση ερωτήματος και ακόμα και όταν είναι δυνατή η αναδίπλωση ερωτήματος ενδέχεται να υπάρχουν ροές δεδομένων που εκτελούν συγκεκριμένους μετασχηματισμούς που δεν μπορούν να αναδιπλωθούν στην προέλευση. Σε αυτές τις περιπτώσεις, η βελτιωμένη μηχανή υπολογιστικής λειτουργίας είναι μια δυνατότητα που εισάγεται από το Power BI για ενδεχόμενη βελτίωση της απόδοσης έως και 25 φορές, ειδικά για μετασχηματισμούς.
Χρήση της μηχανής υπολογιστικής λειτουργίας για μεγιστοποίηση των επιδόσεων
Παρόλο που το Power Query έχει ορατότητα χρόνου σχεδίασης στην αναδίπλωση ερωτήματος, η στήλη μηχανής υπολογιστικής λειτουργίας παρέχει λεπτομέρειες σχετικά με το εάν χρησιμοποιείται η ίδια η εσωτερική μηχανή. Η μηχανή υπολογιστικής λειτουργίας είναι χρήσιμη όταν έχετε μια σύνθετη ροή δεδομένων και εκτελείτε μετασχηματισμούς στη μνήμη. Σε αυτή την περίπτωση, τα στατιστικά στοιχεία βελτιωμένης ανανέωσης μπορεί να είναι χρήσιμα, καθώς η στήλη της μηχανής υπολογιστικής λειτουργίας παρέχει λεπτομέρειες σχετικά με το αν χρησιμοποιήθηκε ή όχι η ίδια η μηχανή.
Οι παρακάτω ενότητες παρέχουν οδηγίες σχετικά με τη χρήση της μηχανής υπολογιστικής λειτουργίας και των στατιστικών της.
Προειδοποίηση
Κατά τη διάρκεια του χρόνου σχεδίασης, η ένδειξη αναδίπλωσης στο πρόγραμμα επεξεργασίας μπορεί να δείξει ότι το ερώτημα δεν αναδιπλώνεται όταν καταναλώνει δεδομένα από μια άλλη ροή δεδομένων. Ελέγξτε τη ροή δεδομένων προέλευσης εάν είναι ενεργοποιημένη η βελτιωμένη υπολογιστική λειτουργία για να εξασφαλίσετε ότι είναι ενεργοποιημένη η αναδίπλωση στη ροή δεδομένων προέλευσης.
Οδηγίες σχετικά με τις καταστάσεις μηχανής υπολογιστικής λειτουργίας
Η ενεργοποίηση της βελτιωμένης μηχανής υπολογιστικής λειτουργίας και η κατανόηση των διαφόρων καταστάσεων είναι χρήσιμη. Εσωτερικά, η βελτιωμένη μηχανή υπολογιστικής λειτουργίας χρησιμοποιεί μια βάση δεδομένων SQL για την ανάγνωση και αποθήκευση δεδομένων. Είναι προτιμότερο οι μετασχηματισμοί σας να εκτελούνται σε σχέση με τη μηχανή ερωτημάτων εδώ. Οι παρακάτω παράγραφοι παρέχουν διάφορες καταστάσεις και οδηγίες σχετικά με το τι πρέπει να κάνετε για κάθε μία από αυτές.
NA - Αυτή η κατάσταση σημαίνει ότι δεν χρησιμοποιήθηκε η μηχανή υπολογιστικής λειτουργίας, είτε επειδή:
- Χρησιμοποιείτε ροές δεδομένων Power BI Pro.
- Απενεργοποιήσατε ρητά τη μηχανή υπολογιστικής λειτουργίας.
- Χρησιμοποιείτε αναδίπλωση ερωτήματος στην προέλευση δεδομένων.
- Εκτελείτε σύνθετους μετασχηματισμούς που δεν μπορούν να χρησιμοποιήσουν τη μηχανή SQL που χρησιμοποιείται για την επιτάχυνση των ερωτημάτων.
Εάν αντιμετωπίζετε μεγάλες διάρκειες και εξακολουθείτε να λαμβάνετε την κατάσταση NA, βεβαιωθείτε ότι είναι ενεργοποιημένη και δεν απενεργοποιούνται κατά λάθος. Ένα προτεινόμενο μοτίβο είναι να χρησιμοποιήσετε ροές δεδομένων προεργασίας για να εισαγάγετε αρχικά τα δεδομένα σας στον Υπηρεσία Power BI και, στη συνέχεια, να δημιουργήσετε ροές δεδομένων πάνω από αυτά τα δεδομένα, αφού βρίσκονται σε μια ροή δεδομένων προεργασίας. Αυτό το μοτίβο μπορεί να μειώσει το φόρτο στα συστήματα προέλευσης και, μαζί με τη μηχανή υπολογιστικής λειτουργίας, να αυξήσει την ταχύτητα για μετασχηματισμούς και να βελτιώσει την απόδοση.
Cache - Εάν βλέπετε την κατάσταση στο cache, τα δεδομένα ροής δεδομένων αποθηκεύτηκε στη μηχανή υπολογιστικής λειτουργίας και ήταν διαθέσιμα για αναφορά ως μέρος ενός άλλου ερωτήματος. Αυτή η κατάσταση είναι ιδανική εάν τη χρησιμοποιείτε ως συνδεδεμένη οντότητα, επειδή η μηχανή υπολογιστικής λειτουργίας αποθηκεύει στο cache αυτά τα δεδομένα για χρήση κατάντη. Τα δεδομένα στο cache δεν χρειάζεται να ανανεώνονται πολλές φορές στην ίδια ροή δεδομένων. Αυτή η κατάσταση είναι επίσης πιθανώς ιδανική εάν θέλετε να τη χρησιμοποιήσετε για το DirectQuery.
Όταν αποθηκεύεται στο cache, η επίδραση των επιδόσεων στην αρχική πρόσληψη δεδομένων αποδίδει αργότερα, στην ίδια ροή δεδομένων ή σε διαφορετική ροή δεδομένων στον ίδιο χώρο εργασίας.
Εάν έχετε μεγάλη διάρκεια για την οντότητα, εξετάστε το ενδεχόμενο να απενεργοποιήσετε τη μηχανή υπολογιστικής λειτουργίας. Για να αποθηκεύσετε προσωρινά την οντότητα, το Power BI την εγγράφει στον χώρο αποθήκευσης και στο SQL. Εάν πρόκειται για οντότητα μίας χρήσης, το όφελος επιδόσεων για τους χρήστες μπορεί να μην αξίζει την ποινή της διπλής πρόσληψης.
Αναδιπλωμένη - Αναδιπλωμένη σημαίνει ότι η ροή δεδομένων ήταν σε θέση να χρησιμοποιήσει τον υπολογισμό SQL για την ανάγνωση δεδομένων. Η υπολογιζόμενη οντότητα χρησιμοποίησε τον πίνακα από το SQL για την ανάγνωση δεδομένων και η SQL που χρησιμοποιείται σχετίζεται με τις κατασκευές του ερωτήματός τους.
Η αναδιπλωμένη κατάσταση εμφανίζεται εάν, όταν χρησιμοποιείτε προελεύσεις δεδομένων εσωτερικής εγκατάστασης ή cloud, φορτώσατε πρώτα δεδομένα σε μια ροή δεδομένων προεργασίας και αναφέρατε αυτό σε αυτήν τη ροή δεδομένων. Αυτή η κατάσταση ισχύει μόνο για οντότητες που αναφέρονται σε μια άλλη οντότητα. Αυτό σημαίνει ότι τα ερωτήματά σας εκτελέστηκαν στη μηχανή SQL και έχουν τη δυνατότητα να βελτιωθούν με την υπολογιστική λειτουργία SQL. Για να εξασφαλίσετε ότι η μηχανή SQL επεξεργάζεται τους μετασχηματισμούς σας, χρησιμοποιήστε μετασχηματισμούς που υποστηρίζουν αναδίπλωση SQL, όπως συγχώνευση (σύνδεση), ομαδοποίηση κατά (συνάθροιση) και ενέργειες προσάρτησης (ένωσης) στον πρόγραμμα επεξεργασίας Power Query.
Προσωρινά αποθηκευμένη + Αναδιπλωμένη - Όταν βλέπετε την προσωρινή μνήμη + αναδιπλωμένη, είναι πιθανό ότι η ανανέωση δεδομένων έχει βελτιστοποιηθεί, καθώς έχετε μια οντότητα που αναφέρεται σε μια άλλη οντότητα και αναφέρεται σε μια άλλη οντότητα και αναφέρεται από μια άλλη οντότητα upstream. Αυτή η λειτουργία εκτελείται επίσης στην κορυφή της SQL και, ως εκ τούτου, έχει επίσης τη δυνατότητα βελτίωσης με την υπολογιστική SQL. Για να βεβαιωθείτε ότι έχετε τις καλύτερες δυνατές επιδόσεις, χρησιμοποιήστε μετασχηματισμούς που υποστηρίζουν αναδίπλωση SQL, όπως συγχώνευση (σύνδεση), ομαδοποίηση κατά (συνάθροιση) και ενέργειες προσάρτησης (ένωσης) στο πρόγραμμα επεξεργασίας Power Query.
Οδηγίες για τη βελτιστοποίηση απόδοσης μηχανής υπολογιστικής λειτουργίας
Τα παρακάτω βήματα επιτρέπουν στους φόρτους εργασίας να ενεργοποιούν τη μηχανή υπολογιστικής λειτουργίας και, επομένως, να βελτιώνουν πάντα την απόδοση.
Υπολογισμένες και συνδεδεμένες οντότητες στον ίδιο χώρο εργασίας:
Για πρόσληψη δεδομένων, εστιάστε στη λήψη των δεδομένων στον χώρο αποθήκευσης όσο το δυνατόν ταχύτερα, χρησιμοποιήστε φίλτρα μόνο εάν μειώνουν το συνολικό μέγεθος μοντέλου σημασιολογίας. Διατηρήστε τη λογική μετασχηματισμού σας ξεχωριστή από αυτό το βήμα. Στη συνέχεια, διαχωρίστε τον μετασχηματισμό και την επιχειρηματική λογική σε ξεχωριστή ροή δεδομένων στον ίδιο χώρο εργασίας. Χρήση συνδεδεμένων ή υπολογισμένων οντοτήτων. Αυτή η ενέργεια επιτρέπει στην μηχανή να ενεργοποιείται και να επιταχύνει τους υπολογισμούς σας. Για μια απλή αναλογία, είναι όπως η προετοιμασία φαγητού σε μια κουζίνα: η προετοιμασία του φαγητού είναι συνήθως ένα ξεχωριστό και διακριτό βήμα από τη συγκέντρωση των ωμών συστατικών σας και προαπαιτείται για την τοποθέτηση του φαγητού στον φούρνο. Παρομοίως, πρέπει να προετοιμάσετε τη λογική σας ξεχωριστά, για να μπορέσει να εκμεταλλευτεί τη μηχανή υπολογιστικής λειτουργίας.
Βεβαιωθείτε ότι εκτελείτε τις λειτουργίες που αναδιπλώνονται, όπως συγχωνεύσεις, ενώσεις, μετατροπές και άλλες.
Επίσης, δημιουργήστε ροές δεδομένων μέσα σε δημοσιευμένες οδηγίες και περιορισμούς.
Όταν η μηχανή υπολογιστικής λειτουργίας είναι ενεργοποίηση, αλλά οι επιδόσεις είναι αργές:
Λάβετε τα παρακάτω βήματα κατά τη διερεύνηση σεναρίων όπου η μηχανή υπολογιστικής λειτουργίας είναι ενεργοποιημένη, αλλά βλέπετε χαμηλές επιδόσεις:
- Περιορίστε τις υπολογισμένες και συνδεδεμένες οντότητες που υπάρχουν σε όλο τον χώρο εργασίας.
- Εάν η αρχική ανανέωση είναι ενεργοποιημένη με τη μηχανή υπολογιστικής λειτουργίας ενεργοποιημένη, τα δεδομένα γράφονται στη λίμνη και στο cache. Αυτή η διπλή εγγραφή έχει ως αποτέλεσμα οι ανανεώσεις να είναι πιο αργές.
- Εάν έχετε μια ροή δεδομένων που συνδέεται σε πολλές ροές δεδομένων, βεβαιωθείτε ότι προγραμματίζετε ανανεώσεις των ροών δεδομένων προέλευσης, ώστε να μην ανανεώνονται όλες ταυτόχρονα.
Ζητήματα προς εξέταση και περιορισμοί
Μια άδεια χρήσης Power BI Pro έχει ένα όριο ανανέωσης ροών δεδομένων με 8 ανανεώσεις την ημέρα.