Επισκόπηση του Direct Lake
Το Direct Lake είναι μια επιλογή λειτουργίας αποθήκευσης για πίνακες σε ένα σημασιολογικό μοντέλο Power BI που είναι αποθηκευμένο σε έναν χώρο εργασίας Microsoft Fabric. Βελτιστοποιείται για μεγάλους όγκους δεδομένων που μπορούν να φορτωθούν γρήγορα στη μνήμη από πίνακες Delta, οι οποίοι αποθηκεύουν τα δεδομένα τους σε αρχεία Parquet στο OneLake, τον μοναδικό χώρο αποθήκευσης για όλα τα δεδομένα ανάλυσης. Όταν φορτωθεί στη μνήμη, το μοντέλο σημασιολογίας επιτρέπει ερωτήματα υψηλών επιδόσεων. Το Direct Lake εξαλείφει την αργή και δαπανηρή ανάγκη εισαγωγής δεδομένων στο μοντέλο.
Μπορείτε να χρησιμοποιήσετε τη λειτουργία αποθήκευσης Direct Lake για να συνδεθείτε στους πίνακες ή τις προβολές μιας μοναδικής λίμνης Fabric ή αποθήκης Fabric. Αμφότερα αυτά τα στοιχεία Fabric και τα σημασιολογικά μοντέλα Direct Lake απαιτούν άδεια χρήσης εκχωρημένων πόρων Fabric.
Κατά κάποιον τρόπο, ένα σημασιολογικό μοντέλο Direct Lake είναι παρόμοιο με ένα σημασιολογικό μοντέλο εισαγωγής. Αυτό συμβαίνει επειδή τα δεδομένα μοντέλου φορτώνονται στη μνήμη από τη μηχανή VertiPaq για γρήγορες επιδόσεις ερωτημάτων (εκτός από την περίπτωση επιστροφής του DirectQuery, η οποία εξηγείται παρακάτω σε αυτό το άρθρο).
Ωστόσο, ένα σημασιολογικό μοντέλο Direct Lake διαφέρει από ένα σημασιολογικό μοντέλο εισαγωγής με έναν σημαντικό τρόπο. Αυτό συμβαίνει επειδή μια λειτουργία ανανέωσης για ένα σημασιολογικό μοντέλο Direct Lake διαφέρει εννοιολογικά σε σχέση με μια λειτουργία ανανέωσης για ένα σημασιολογικό μοντέλο εισαγωγής. Για ένα σημασιολογικό μοντέλο Direct Lake, μια ανανέωση περιλαμβάνει μια λειτουργία πλαισίου (περιγράφεται παρακάτω σε αυτό το άρθρο), η οποία μπορεί να διαρκέσει μερικά δευτερόλεπτα για να ολοκληρωθεί. Πρόκειται για μια λειτουργία χαμηλού κόστους όπου το μοντέλο σημασιολογίας αναλύει τα μετα-δεδομένα της πιο πρόσφατης έκδοσης των πινάκων Delta και ενημερώνεται ώστε να αναφέρεται στα πιο πρόσφατα αρχεία στο OneLake. Αντίθετα, για ένα σημασιολογικό μοντέλο εισαγωγής, μια ανανέωση παράγει ένα αντίγραφο των δεδομένων, το οποίο μπορεί να χρειαστεί αρκετό χρόνο και να καταναλώσει σημαντικούς πόρους προέλευσης δεδομένων και εκχωρημένων πόρων (μνήμη και CPU).
Σημείωμα
Η επαυξητική ανανέωση για ένα μοντέλο σημασιολογίας εισαγωγής μπορεί να βοηθήσει στη μείωση του χρόνου ανανέωσης και της χρήσης εκχωρημένων πόρων.
Πότε πρέπει να χρησιμοποιήσετε τη λειτουργία αποθήκευσης Direct Lake;
Η κύρια περίπτωση χρήσης για μια λειτουργία αποθήκευσης Direct Lake είναι συνήθως για έργα ανάλυσης που βασίζονται σε IT και αξιοποιούν αρχιτεκτονικές που βασίζονται σε λίμνες. Σε αυτό το σενάριο, έχετε ή περιμένετε να συγκεντρώσετε μεγάλους όγκους δεδομένων στο OneLake. Η γρήγορη φόρτωση αυτών των δεδομένων στη μνήμη, οι συχνές και γρήγορες λειτουργίες ανανέωσης, η αποτελεσματική χρήση εκχωρημένων πόρων και οι γρήγορες επιδόσεις ερωτημάτων είναι όλα σημαντικά για αυτή την περίπτωση χρήσης.
Σημείωμα
Τα σημασιολογικά μοντέλα εισαγωγής και DirectQuery εξακολουθούν να είναι σχετικά στο Fabric και αποτελούν τη σωστή επιλογή σημασιολογικού μοντέλου για ορισμένα σενάρια. Για παράδειγμα, η λειτουργία αποθήκευσης Εισαγωγή συχνά λειτουργεί καλά για έναν αναλυτή αυτοεξυπηρέτησης που χρειάζεται ελευθερία και ευελιξία για να ενεργεί γρήγορα και χωρίς εξάρτηση στο τμήμα IT για να προσθέσει νέα στοιχεία δεδομένων.
Επίσης, η ενοποίηση OneLake εγγράφει αυτόματα δεδομένα για πίνακες σε λειτουργία αποθήκευσης Εισαγωγή σε πίνακες Delta στο OneLake χωρίς να περιλαμβάνει καμία προσπάθεια μετεγκατάστασης. Χρησιμοποιώντας αυτή την επιλογή, μπορείτε να αξιοποιήσετε πολλά από τα πλεονεκτήματα του Fabric που διατίθενται στους χρήστες μοντέλου σημασιολογίας εισαγωγής, όπως ενοποίηση με lakehouses μέσω συντομεύσεων, ερωτημάτων SQL, σημειωματάριων και πολλών άλλων. Συνιστούμε να θεωρήσετε αυτή την επιλογή ως έναν γρήγορο τρόπο για να αποκομίσετε τα οφέλη του Fabric χωρίς να επανασχεδιάσετε απαραίτητα ή αμέσως την υπάρχουσα αποθήκη δεδομένων ή/και σύστημα ανάλυσης.
Η λειτουργία αποθήκευσης Direct Lake είναι επίσης κατάλληλη για την ελαχιστοποίηση του λανθάνοντος χρόνου δεδομένων για τη γρήγορη διάθεση δεδομένων στους χρήστες επιχειρήσεων. Εάν οι πίνακες Delta τροποποιούνται κατά διαστήματα (και υποθέτοντας ότι έχετε ήδη κάνει προετοιμασία δεδομένων στη λίμνη δεδομένων), μπορείτε να βασίζεστε σε αυτόματες ενημερώσεις για να αναδιαμορφώσετε το πλαίσιο ως απάντηση σε αυτές τις τροποποιήσεις. Σε αυτή την περίπτωση, τα ερωτήματα που αποστέλλονται στο μοντέλο σημασιολογίας θα επιστρέφουν τα πιο πρόσφατα δεδομένα. Αυτή η δυνατότητα λειτουργεί καλά σε συνεργασία με τη δυνατότητα αυτόματης ανανέωσης σελίδας των αναφορών Power BI.
Να θυμάστε ότι το Direct Lake εξαρτάται από την προετοιμασία δεδομένων που γίνεται στη λίμνη δεδομένων. Η προετοιμασία δεδομένων μπορεί να γίνει χρησιμοποιώντας διάφορα εργαλεία, όπως εργασίες Spark για lakehouses Fabric, προτάσεις DML T-SQL για αποθήκες Fabric, ροές δεδομένων, διοχετεύσεις και άλλα. Αυτή η προσέγγιση βοηθά να εξασφαλίσετε ότι η λογική προετοιμασίας δεδομένων εκτελείται όσο το δυνατόν χαμηλότερα στην αρχιτεκτονική για μεγιστοποίηση της επαναχρησιμοποίησης. Ωστόσο, εάν ο συντάκτης σημασιολογικού μοντέλου δεν έχει τη δυνατότητα να τροποποιήσει το στοιχείο προέλευσης, για παράδειγμα, στην περίπτωση ενός αναλυτή αυτοεξυπηρέτησης που μπορεί να μην έχει δικαιώματα εγγραφής σε μια λίμνη που διαχειρίζεται το τμήμα IT, τότε η λειτουργία αποθήκευσης Εισαγωγή μπορεί να είναι μια καλύτερη επιλογή. Αυτό συμβαίνει επειδή υποστηρίζει την προετοιμασία δεδομένων χρησιμοποιώντας το Power Query, το οποίο ορίζεται ως μέρος του μοντέλου σημασιολογίας.
Φροντίστε να συνυπολογιστείτε στην τρέχουσα άδεια χρήσης εκχωρημένων πόρων Fabric και τα προστατευτικά των εκχωρημένων πόρων Fabric, όταν εξετάζετε τη λειτουργία αποθήκευσης Direct Lake. Επίσης, συνυπολογίζονται στα ζητήματα και τους περιορισμούς που περιγράφονται παρακάτω σε αυτό το άρθρο.
Φιλοδώρημα
Συνιστούμε να δημιουργήσετε ένα πρωτότυπο ή επαλήθευση ιδέας (POC) για να προσδιορίσετε εάν ένα σημασιολογικό μοντέλο Direct Lake είναι η σωστή λύση και να μετριάσετε τον κίνδυνο.
Πώς λειτουργεί το Direct Lake
Συνήθως, ο χειρισμός των ερωτημάτων που αποστέλλονται σε ένα μοντέλο σημασιολογίας Direct Lake γίνεται από μια cache στη μνήμη των στηλών που προέρχονται από πίνακες Delta. Ο υποκείμενος χώρος αποθήκευσης για έναν πίνακα Delta είναι ένα ή περισσότερα αρχεία Parquet στο OneLake. Τα αρχεία Parquet οργανώνουν δεδομένα κατά στήλες αντί για γραμμές. Τα σημασιολογικά μοντέλα φορτώνουν ολόκληρες στήλες από πίνακες Delta στη μνήμη, όπως απαιτείται από τα ερωτήματα.
Ένα σημασιολογικό μοντέλο Direct Lake μπορεί επίσης να χρησιμοποιεί την εναλλακτική λύση DirectQuery, η οποία περιλαμβάνει την απρόσκοπτη μετάβαση σε λειτουργία DirectQuery. Η εναλλακτική λύση DirectQuery ανακτά δεδομένα απευθείας από το τελικό σημείο ανάλυσης SQL του lakehouse ή της αποθήκης. Για παράδειγμα, μπορεί να προκύψει επιστροφή όταν ένας πίνακας Delta περιέχει περισσότερες γραμμές δεδομένων από όσες υποστηρίζονται από τους εκχωρημένους πόρους Fabric (περιγράφονται παρακάτω σε αυτό το άρθρο). Σε αυτή την περίπτωση, μια λειτουργία DirectQuery στέλνει ένα ερώτημα στο τελικό σημείο ανάλυσης SQL. Οι λειτουργίες επιστροφής μπορεί να έχουν ως αποτέλεσμα πιο αργή απόδοση του ερωτήματος.
Το παρακάτω διάγραμμα δείχνει πώς λειτουργεί το Direct Lake χρησιμοποιώντας το σενάριο ενός χρήστη που ανοίγει μια αναφορά Power BI.
Το διάγραμμα απεικονίζει τις ακόλουθες ενέργειες, διαδικασίες και δυνατότητες του χρήστη.
Στοιχείο | Περιγραφή |
---|---|
Το OneLake είναι μια λίμνη δεδομένων που αποθηκεύει δεδομένα ανάλυσης σε μορφή Parquet. Αυτή η μορφή αρχείου είναι βελτιστοποιημένη για την αποθήκευση δεδομένων για σημασιολογικά μοντέλα Direct Lake. | |
Μια αποθήκη Fabric lakehouse ή αποθήκη Fabric υπάρχει σε έναν χώρο εργασίας που βρίσκεται σε εκχωρημένους πόρους Fabric. Η λίμνη διαθέτει ένα τελικό σημείο ανάλυσης SQL, το οποίο παρέχει μια εμπειρία βάσει SQL για την υποβολή ερωτημάτων. Οι πίνακες (ή οι προβολές) παρέχουν έναν τρόπο υποβολής ερωτημάτων στους πίνακες Delta στο OneLake χρησιμοποιώντας Transact-SQL (T-SQL). | |
Υπάρχει ένα σημασιολογικό μοντέλο Direct Lake σε έναν χώρο εργασίας Fabric. Συνδέεται σε πίνακες ή προβολές είτε στο lakehouse, είτε στην αποθήκη. | |
Ένας χρήστης ανοίγει μια αναφορά Power BI. | |
Η αναφορά Power BI στέλνει ερωτήματα παραστάσεων ανάλυσης δεδομένων (DAX) στο μοντέλο σημασιολογίας Direct Lake. | |
Όταν είναι δυνατό (και απαραίτητο), το μοντέλο σημασιολογίας φορτώνει στήλες στη μνήμη απευθείας από τα αρχεία Parquet που είναι αποθηκευμένα στο OneLake. Τα ερωτήματα επιτυγχάνουν επιδόσεις στη μνήμη, η οποία είναι πολύ γρήγορη. | |
Το μοντέλο σημασιολογίας επιστρέφει αποτελέσματα ερωτήματος. | |
Η αναφορά Power BI αποδίδει τις απεικονίσεις. | |
Σε ορισμένες περιπτώσεις, όπως όταν το μοντέλο σημασιολογίας υπερβαίνει τα προστατευτικά των εκχωρημένων πόρων, τα ερωτήματα σημασιολογικού μοντέλου επιστρέφουν αυτόματα στη λειτουργία DirectQuery. Σε αυτήν την κατάσταση λειτουργίας, τα ερωτήματα αποστέλλονται στο τελικό σημείο ανάλυσης SQL της λίμνης ή αποθήκης. | |
Τα ερωτήματα DirectQuery που αποστέλλονται στο τελικό σημείο ανάλυσης SQL υποβάλλουν ερώτημα στους πίνακες Delta στο OneLake. Για αυτόν τον λόγο, οι επιδόσεις ερωτημάτων μπορεί να είναι πιο αργές από τα ερωτήματα στη μνήμη. |
Οι παρακάτω ενότητες περιγράφουν τις έννοιες και τις δυνατότητες του Direct Lake, όπως φόρτωση στηλών, διαμόρφωση, αυτόματες ενημερώσεις και επιστροφή DirectQuery.
Φόρτωση στήλης (μετάγγισμα)
Τα σημασιολογικά μοντέλα Direct Lake φορτώνουν μόνο δεδομένα από το OneLake ως και κατά την υποβολή ερωτημάτων σε στήλες για πρώτη φορά. Η διαδικασία φόρτωσης δεδομένων κατ' απαίτηση από το OneLake είναι γνωστή ως transcoding.
Όταν το μοντέλο σημασιολογίας λαμβάνει ένα ερώτημα DAX (ή Πολυδιάστατες παραστάσεις —MDX), προσδιορίζει πρώτα ποιες στήλες απαιτούνται για την παραγωγή ενός αποτελέσματος ερωτήματος. Οι στήλες που είναι απαραίτητες περιλαμβάνουν οποιεσδήποτε στήλες που χρησιμοποιούνται απευθείας από το ερώτημα, καθώς και στήλες που απαιτούνται από σχέσεις και μετρήσεις. Συνήθως, ο αριθμός των στηλών που απαιτούνται για την παραγωγή ενός αποτελέσματος ερωτήματος είναι πολύ μικρότερος από τον αριθμό των στηλών που ορίζονται στο μοντέλο σημασιολογίας.
Όταν γίνει κατανοητό ποιες στήλες απαιτούνται, το μοντέλο σημασιολογίας καθορίζει ποιες στήλες βρίσκονται ήδη στη μνήμη. Εάν οποιεσδήποτε στήλες που απαιτούνται για το ερώτημα δεν βρίσκονται στη μνήμη, το μοντέλο σημασιολογίας φορτώνει όλα τα δεδομένα για αυτές τις στήλες από το OneLake. Η φόρτωση δεδομένων στήλης είναι συνήθως μια πολύ γρήγορη λειτουργία, ωστόσο μπορεί να εξαρτάται από παράγοντες όπως η πληθικότητα των δεδομένων που είναι αποθηκευμένα στις στήλες.
Στη συνέχεια , οι στήλες που φορτώνονται στη μνήμη διαμένουν στη μνήμη. Τα μελλοντικά ερωτήματα που αφορούν μόνο στήλες κάτοικου δεν χρειάζεται να φορτώσουν άλλες στήλες στη μνήμη.
Μια στήλη παραμένει κάτοικος μέχρι να υπάρχει λόγος για την κατάργησή της (εκκαθαριστεί) από τη μνήμη. Οι λόγοι για τους οποίους μπορεί να καταργηθούν στήλες περιλαμβάνουν τα εξής:
- Το μοντέλο ή ο πίνακας έχει ανανεωθεί (ανατρέξτε στην ενότητα Διαμόρφωση στην επόμενη ενότητα).
- Κανένα ερώτημα δεν έχει χρησιμοποιήσει τη στήλη εδώ και αρκετό καιρό.
- Άλλοι λόγοι διαχείρισης μνήμης, συμπεριλαμβανομένης της πίεσης μνήμης στους εκχωρημένους πόρους λόγω άλλων, ταυτόχρονων λειτουργιών.
Η επιλογή σας SKU Fabric καθορίζει τη μέγιστη διαθέσιμη μνήμη για κάθε μοντέλο σημασιολογίας Direct Lake στο σύνολο εκχωρημένων πόρων. Για περισσότερες πληροφορίες σχετικά με τα προστατευτικά πόρων και τα όρια μέγιστης μνήμης, ανατρέξτε στο θέμα Προστατευτικά και περιορισμοί εκχωρημένων πόρων Fabric παρακάτω σε αυτό το άρθρο.
Διαμόρφωση
Η διαμόρφωση παρέχει στους κατόχους μοντέλων έλεγχο σε χρονικό σημείο σχετικά με τα δεδομένα που φορτώνονται στο μοντέλο σημασιολογίας. Το framing είναι μια λειτουργία Direct Lake που ενεργοποιείται από μια ανανέωση ενός μοντέλου σημασιολογίας και στις περισσότερες περιπτώσεις χρειάζονται μόνο λίγα δευτερόλεπτα για να ολοκληρωθεί. Αυτό συμβαίνει επειδή πρόκειται για μια λειτουργία χαμηλού κόστους όπου το σημασιολογικό μοντέλο αναλύει τα μετα-δεδομένα της τελευταίας έκδοσης των πινάκων Delta Lake και ενημερώνεται για αναφορά στα πιο πρόσφατα αρχεία Parquet στο OneLake.
Όταν παρουσιαστεί διαμόρφωση, οι στήλες διαμένων μπορούν να καταργηθούν από τη μνήμη και το χρονικό σημείο της ανανέωσης μετατρέπεται στη νέα γραμμή βάσης για όλα τα μελλοντικά συμβάντα μεταμορφώσεων. Από αυτό το σημείο, τα ερωτήματα Direct Lake εξετάζουν μόνο δεδομένα στους πίνακες Delta την ώρα της πιο πρόσφατης λειτουργίας διαμόρφωσης. Για αυτόν τον λόγο, ζητείται από τους πίνακες Direct Lake να επιστρέψουν δεδομένα με βάση την κατάσταση του πίνακα Delta στο σημείο της πιο πρόσφατης λειτουργίας διαμόρφωσης. Αυτή η ώρα δεν είναι απαραίτητα η τελευταία κατάσταση των πινάκων Delta.
Το παρακάτω διάγραμμα δείχνει πώς λειτουργούν οι λειτουργίες πλαισίου Direct Lake.
Το διάγραμμα απεικονίζει τις ακόλουθες διαδικασίες και δυνατότητες.
Στοιχείο | Περιγραφή |
---|---|
Υπάρχει ένα σημασιολογικό μοντέλο σε έναν χώρο εργασίας Fabric. | |
Οι λειτουργίες διαμόρφωσης πραγματοποιούνται περιοδικά και ορίζουν τη γραμμή βάσης για όλα τα μελλοντικά συμβάντα μετάθεσης . Οι λειτουργίες πλαισίωσης μπορούν να πραγματοποιούνται αυτόματα, με μη αυτόματο τρόπο, βάσει χρονοδιαγράμματος ή μέσω προγραμματισμού. | |
Η OneLake αποθηκεύει μετα-δεδομένα και αρχεία Parquet, τα οποία αντιπροσωπεύονται ως πίνακες Delta. | |
Η τελευταία λειτουργία διαμόρφωσης περιλαμβάνει αρχεία Parquet που σχετίζονται με τους πίνακες Delta και συγκεκριμένα τα αρχεία Parquet που προστέθηκαν πριν από την τελευταία λειτουργία διαμόρφωσης. | |
Μια μεταγενέστερη λειτουργία διαμόρφωσης περιλαμβάνει αρχεία Parquet που προστέθηκαν μετά την τελευταία λειτουργία διαμόρφωσης. | |
Οι στήλες μόνιμης εγκατάστασης στο μοντέλο σημασιολογίας Direct Lake μπορούν να καταργηθούν από τη μνήμη και το χρονικό σημείο της ανανέωσης μετατρέπεται στη νέα γραμμή βάσης για όλα τα μελλοντικά συμβάντα μεταμορφώσεων. | |
Οι επόμενες τροποποιήσεις δεδομένων, που αντιπροσωπεύονται από νέα αρχεία Parquet, δεν είναι ορατές μέχρι να πραγματοποιηθεί η επόμενη λειτουργία διαμόρφωσης. |
Δεν είναι πάντα επιθυμητό να υπάρχουν δεδομένα που αντιπροσωπεύουν την τελευταία κατάσταση οποιουδήποτε πίνακα Delta όταν πραγματοποιείται μια λειτουργία μεταγραφής. Λάβετε υπόψη ότι η διαμόρφωση μπορεί να σας βοηθήσει να παρέχετε συνεπή αποτελέσματα ερωτημάτων σε περιβάλλοντα όπου τα δεδομένα σε πίνακες Delta είναι μεταβατικά. Τα δεδομένα μπορεί να είναι προσωρινά για διάφορους λόγους, όπως όταν πραγματοποιούνται διαδικασίες εξαγωγής, μετασχηματισμού και φόρτωσης (ETL) μεγάλης διάρκειας.
Η ανανέωση για ένα σημασιολογικό μοντέλο Direct Lake μπορεί να γίνει με μη αυτόματο τρόπο, αυτόματα ή μέσω προγραμματισμού. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Ανανέωση σημασιολογικών μοντέλων Direct Lake.
Για περισσότερες πληροφορίες σχετικά με τη διαχείριση εκδόσεων και τη διαμόρφωση πινάκων Delta, ανατρέξτε στο θέμα Κατανόηση του χώρου αποθήκευσης για σημασιολογικά μοντέλα Direct Lake.
Αυτόματες ενημερώσεις
Υπάρχει μια ρύθμιση σημασιολογικού επιπέδου μοντέλου για την αυτόματη ενημέρωση των πινάκων Direct Lake. Από προεπιλογή, είναι ενεργοποιημένη. Εξασφαλίζει ότι οι αλλαγές δεδομένων στο OneLake αντικατοπτρίζονται αυτόματα στο σημασιολογικό μοντέλο Direct Lake. Θα πρέπει να απενεργοποιήσετε τις αυτόματες ενημερώσεις όταν θέλετε να ελέγχετε τις αλλαγές δεδομένων μέσω πλαισίου, το οποίο εξηγήθηκε στην προηγούμενη ενότητα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Διαχείριση σημασιολογικών μοντέλων Direct Lake.
Φιλοδώρημα
Μπορείτε να ρυθμίσετε αυτόματη ανανέωση σελίδας στις αναφορές σας Power BI. Είναι μια δυνατότητα που ανανεώνει αυτόματα μια συγκεκριμένη σελίδα αναφοράς, με την προϋπόθεση ότι η αναφορά συνδέεται σε ένα σημασιολογικό μοντέλο Direct Lake (ή άλλους τύπους σημασιολογικού μοντέλου).
Επιστροφή directQuery
Ένα ερώτημα που αποστέλλεται σε ένα μοντέλο σημασιολογίας Direct Lake μπορεί να επιστρέψει στη λειτουργία DirectQuery. Στην περίπτωση αυτή, ανακτά δεδομένα απευθείας από το τελικό σημείο ανάλυσης SQL του lakehouse ή της αποθήκης. Αυτά τα ερωτήματα επιστρέφουν πάντα τα πιο πρόσφατα δεδομένα επειδή δεν περιορίζονται στο χρονικό σημείο της τελευταίας λειτουργίας διαμόρφωσης.
Ένα ερώτημα επιστρέφει πάντα όταν το μοντέλο σημασιολογίας υποβάλλει ερώτημα σε μια προβολή στο τελικό σημείο ανάλυσης SQL ή σε έναν πίνακα στο τελικό σημείο ανάλυσης SQL που επιβάλλει ασφάλεια σε επίπεδο γραμμών (RLS).
Επίσης, ένα ερώτημα μπορεί να επιστρέψει όταν το μοντέλο σημασιολογίας υπερβαίνει τα προστατευτικά του συνόλου εκχωρημένων πόρων.
Σημαντικό
Εάν είναι δυνατό, θα πρέπει πάντα να σχεδιάζετε τη λύση σας ή να αλλάζετε μέγεθος στους εκχωρημένους πόρους σας, για να αποφύγετε την εναλλακτική λύση του DirectQuery. Αυτό συμβαίνει επειδή μπορεί να έχει ως αποτέλεσμα πιο αργή απόδοση του ερωτήματος.
Μπορείτε να ελέγξετε την επιστροφή των σημασιολογικών μοντέλων Direct Lake ορίζοντας την ιδιότητά του DirectLakeBehavior . Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Ορισμός της ιδιότητας συμπεριφοράς Direct Lake.
Προστατευτικά και περιορισμοί χωρητικότητας fabric
Τα σημασιολογικά μοντέλα Direct Lake απαιτούν άδεια χρήσης εκχωρημένων πόρων Fabric. Επίσης, υπάρχουν προστατευτικά και περιορισμοί εκχωρημένων πόρων που ισχύουν για τη συνδρομή σας στο σύνολο εκχωρημένων πόρων Fabric (SKU), όπως παρουσιάζεται στον παρακάτω πίνακα.
Σημαντικό
Η πρώτη στήλη στον παρακάτω πίνακα περιλαμβάνει επίσης συνδρομές εκχωρημένων πόρων Power BI Premium (P SKU). Να γνωρίζετε ότι η Microsoft ενοποιεί επιλογές αγοράς και αποσύρει το Power BI Premium ανά SKU εκχωρημένων πόρων. Οι νέοι και υπάρχοντες πελάτες θα πρέπει να εξετάσουν το ενδεχόμενο αγοράς συνδρομών εκχωρημένων πόρων Fabric (F SKU).
Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Σημαντικές ενημερώσεις που αφορούν την παραχώρηση αδειών χρήσης Power BI Premium και το Power BI Premium.
Fabric SKU | Αρχεία Parquet ανά πίνακα | Ομάδες γραμμών ανά πίνακα | Γραμμές ανά πίνακα (εκατομμύρια) | Μέγιστο μέγεθος μοντέλου στον δίσκο/OneLake (GB) | Μέγιστη μνήμη (GB) 1 |
---|---|---|---|---|---|
F2 | 1,000 | 1,000 | 300 | 10 | 3 |
F4 | 1,000 | 1,000 | 300 | 10 | 3 |
F8 | 1,000 | 1,000 | 300 | 10 | 3 |
F16 | 1,000 | 1,000 | 300 | 20 | 5 |
F32 | 1,000 | 1,000 | 300 | 40 | 10 |
F64/FT1/P1 | 5,000 | 5,000 | 1.500 | Απεριόριστο | 25 |
F128/P2 | 5,000 | 5,000 | 3,000 | Απεριόριστο | 50 |
F256/P3 | 5,000 | 5,000 | 6,000 | Απεριόριστο | 100 |
F512/P4 | 10,000 | 10,000 | 12,000 | Απεριόριστο | 200 |
F1024/P5 | 10,000 | 10,000 | 24,000 | Απεριόριστο | 400 |
F2048 | 10,000 | 10,000 | 24,000 | Απεριόριστο | 400 |
1 Για σημασιολογικά μοντέλα Direct Lake, η Μέγιστη μνήμη αντιπροσωπεύει το ανώτατο όριο πόρων μνήμης για τον όγκο των δεδομένων που μπορούν να σελιδοποιηθούν. Για αυτόν τον λόγο, δεν είναι προστατευτικό γιατί η υπέρβαση του δεν έχει ως αποτέλεσμα την επιστροφή στη λειτουργία DirectQuery. Ωστόσο, μπορεί να έχει επιπτώσεις στις επιδόσεις εάν ο όγκος των δεδομένων είναι αρκετά μεγάλος ώστε να προκαλεί υπερβολική σελιδοποίηση των δεδομένων του μοντέλου από τα δεδομένα του OneLake.
Εάν γίνει υπέρβαση, το Μέγιστο μέγεθος μοντέλου στον δίσκο/OneLake θα προκαλέσει την επαναφορά όλων των ερωτημάτων στη λειτουργία DirectQuery σε όλα τα ερωτήματα στο μοντέλο σημασιολογίας. Όλα τα άλλα προστατευτικά που παρουσιάζονται στον πίνακα αξιολογούνται ανά ερώτημα. Επομένως, είναι σημαντικό να βελτιστοποιήσετε τους πίνακες Delta και το σημασιολογικό μοντέλο Direct Lake για να αποφύγετε την περιττή κλιμάκωση σε υψηλότερο SKU Fabric (με αποτέλεσμα αυξημένο κόστος).
Επιπλέον, τα όρια μνήμης μονάδας εκχωρημένων πόρων και Μέγιστης μνήμης ανά ερώτημα ισχύουν για σημασιολογικά μοντέλα Direct Lake. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Εκχωρημένοι πόροι και SKU.
Ζητήματα προς εξέταση και περιορισμοί
Τα σημασιολογικά μοντέλα Direct Lake παρουσιάζουν ορισμένα ζητήματα και περιορισμούς.
Σημείωμα
Οι δυνατότητες και τα χαρακτηριστικά των σημασιολογικών μοντέλων Direct Lake εξελίσσονται. Φροντίστε να ελέγχετε ξανά περιοδικά για να εξετάσετε την πιο πρόσφατη λίστα ζητημάτων και περιορισμών.
- Όταν ένας πίνακας σημασιολογικού μοντέλου Direct Lake συνδέεται σε έναν πίνακα στο τελικό σημείο ανάλυσης SQL που επιβάλλει ασφάλεια σε επίπεδο γραμμών (RLS), τα ερωτήματα που αφορούν αυτόν τον πίνακα μοντέλου θα επιστρέφουν πάντα στη λειτουργία DirectQuery. Οι επιδόσεις ερωτημάτων μπορεί να είναι πιο αργές.
- Όταν ένας πίνακας σημασιολογικού μοντέλου Direct Lake συνδέεται σε μια προβολή στο τελικό σημείο ανάλυσης SQL, τα ερωτήματα που αφορούν αυτόν τον πίνακα μοντέλου θα επιστρέφουν πάντα στη λειτουργία DirectQuery. Οι επιδόσεις ερωτημάτων μπορεί να είναι πιο αργές.
- Δεν υποστηρίζεται η σύνθετη μοντελοποίηση. Αυτό σημαίνει ότι οι πίνακες σημασιολογικών μοντέλων Direct Lake δεν μπορούν να αναμειχθούν με πίνακες σε άλλες λειτουργίες αποθήκευσης, όπως Εισαγωγή, DirectQuery ή Διπλή (εκτός από ειδικές περιπτώσεις, συμπεριλαμβανομένων των ομάδων υπολογισμού, των παραμέτρων what-if και των παραμέτρων πεδίων).
- Δεν υποστηρίζονται υπολογιζόμενες στήλες και υπολογιζόμενοι πίνακες που αναφέρονται σε στήλες ή πίνακες σε λειτουργία αποθήκευσης Direct Lake. Υποστηρίζονται ομάδες υπολογισμού, παράμετροι what-if και παράμετροι πεδίων, οι οποίες δημιουργούν έμμεσα υπολογιζόμενους πίνακες και υπολογιζόμενους πίνακες που δεν αναφέρουν στήλες ή πίνακες Direct Lake.
- Οι πίνακες λειτουργίας αποθήκευσης Direct Lake δεν υποστηρίζουν σύνθετους τύπους στηλών πίνακα Delta. Οι δυαδικοί τύποι και οι σημασιολογικοί τύποι GUID δεν υποστηρίζονται επίσης. Πρέπει να μετατρέψετε αυτούς τους τύπους δεδομένων σε συμβολοσειρές ή άλλους υποστηριζόμενους τύπους δεδομένων.
- Οι σχέσεις πινάκων απαιτούν να συμφωνούν οι τύποι δεδομένων των σχετικών στηλών.
- Οι στήλες μίας πλευράς των σχέσεων πρέπει να περιέχουν μοναδικές τιμές. Τα ερωτήματα θα αποτύχουν εάν εντοπιστούν διπλότυπες τιμές σε μια στήλη μίας πλευράς.
- Η αυτόματη ευφυΐα δεδομένων/χρόνου στο Power BI Desktop δεν υποστηρίζεται. Υποστηρίζεται η σήμανση του δικού σας πίνακα ημερομηνιών ως πίνακα ημερομηνιών.
- Το μήκος των τιμών στήλης συμβολοσειράς περιορίζεται σε 32.764 χαρακτήρες Unicode.
- Η τιμή κινητής υποδιαστολής NaN (όχι ένας αριθμός) δεν υποστηρίζεται.
- Δεν υποστηρίζονται σενάρια ενσωμάτωσης που χρησιμοποιούν το σενάριο χρήσης για τον πελάτη σας.
- Η δημοσίευση στο web από το Power BI υποστηρίζεται μόνο κατά τη χρήση μιας σταθερής ταυτότητας για το σημασιολογικό μοντέλο Direct Lake.
- Στην εμπειρία μοντελοποίησης web, η επικύρωση είναι περιορισμένη για σημασιολογικά μοντέλα Direct Lake. Οι επιλογές χρήστη θεωρούνται σωστές και δεν εκδίδονται ερωτήματα για την επικύρωση της πληθικότητας ή των επιλογών διασταυρούμενου φιλτραρίσματος για σχέσεις ή για την επιλεγμένη στήλη ημερομηνίας σε έναν πίνακα ημερομηνιών με σήμανση.
- Στην πύλη Fabric, η καρτέλα Direct Lake στο ιστορικό ανανέωσης παραθέτει μόνο τις αποτυχίες ανανέωσης που σχετίζονται με το Direct Lake. Οι επιτυχημένες λειτουργίες ανανέωσης (διαμόρφωσης) δεν παρατίθενται.
- Η SKU Fabric προσδιορίζει τη μέγιστη διαθέσιμη μνήμη ανά σημασιολογικό μοντέλο Direct Lake για τους εκχωρημένους πόρους. Όταν γίνει υπέρβαση του ορίου, τα ερωτήματα προς το μοντέλο σημασιολογίας μπορεί να είναι πιο αργά λόγω υπερβολικής σελιδοποίησης δεδομένων εντός και εκτός του μοντέλου.
- Η δημιουργία ενός σημασιολογικού μοντέλου Direct Lake σε έναν χώρο εργασίας που βρίσκεται σε διαφορετική περιοχή του χώρου εργασίας προέλευσης δεδομένων δεν υποστηρίζεται. Για παράδειγμα, εάν το Lakehouse είναι στις Μεσοδυτικές Η.Π.Α., τότε μπορείτε να δημιουργήσετε σημασιολογικά μοντέλα μόνο από αυτό το Lakehouse στην ίδια περιοχή. Μια λύση είναι να δημιουργήσετε ένα Lakehouse στον χώρο εργασίας της άλλης περιοχής και να συντομεύετε τους πίνακες πριν από τη δημιουργία του μοντέλου σημασιολογίας. Για να βρείτε την περιοχή στην οποία βρίσκεστε, ανατρέξτε στο θέμα Εύρεση της αρχικής περιοχής σας Fabric.
- Μπορείτε να δημιουργήσετε και να προβάλετε ένα προσαρμοσμένο μοντέλο σημασιολογίας Direct Lake χρησιμοποιώντας μια ταυτότητα κύριας υπηρεσίας, αλλά το προεπιλεγμένο σημασιολογικό μοντέλο Direct Lake δεν υποστηρίζει οντότητες υπηρεσίας. Βεβαιωθείτε ότι ο έλεγχος ταυτότητας κύριας υπηρεσίας είναι ενεργοποιημένος για τα REST API Fabric στον μισθωτή σας και εκχωρήστε στην κύρια υπηρεσία δικαιώματα Συμβάλλων ή υψηλότερα δικαιώματα στον χώρο εργασίας του σημασιολογικού μοντέλου Direct Lake.
- Το Direct Lake δεν υποστηρίζει προφίλ κύριας υπηρεσίας για έλεγχο ταυτότητας.
Σύγκριση με άλλες λειτουργίες αποθήκευσης
Ο παρακάτω πίνακας συγκρίνει τη λειτουργία αποθήκευσης Direct Lake με τις λειτουργίες αποθήκευσης εισαγωγής και DirectQuery.
Δυνατότητα | Direct Lake | Εισαγωγή | DirectQuery |
---|---|---|---|
Παραχώρηση αδειών χρήσης | Συνδρομή εκχωρημένων πόρων Fabric (SKU) μόνο | Οποιαδήποτε άδεια χρήσης Fabric ή Power BI (συμπεριλαμβανομένων των δωρεάν αδειών χρήσης Microsoft Fabric) | Οποιαδήποτε άδεια χρήσης Fabric ή Power BI (συμπεριλαμβανομένων των δωρεάν αδειών χρήσης Microsoft Fabric) |
Data source | Μόνο πίνακες lakehouse ή αποθηκών (ή προβολές) | Οποιαδήποτε σύνδεση | Οποιαδήποτε σύνδεση που υποστηρίζει τη λειτουργία DirectQuery |
Σύνδεση σε προβολές τελικού σημείου ανάλυσης SQL | Ναι , αλλά θα επανέλθετε αυτόματα στη λειτουργία DirectQuery | Όχι | Όχι |
Σύνθετα μοντέλα | Νο 1 | Ναι – μπορεί να συνδυαστεί με directQuery ή διπλούς πίνακες λειτουργίας αποθήκευσης | Ναι – δυνατότητα συνδυασμού με πίνακες λειτουργίας αποθήκευσης "Εισαγωγή" ή "Διπλή" |
Καθολική σύνδεση (SSO) | Όχι | Δεν ισχύει | Όχι |
Υπολογιζόμενοι πίνακες | Όχι – εκτός από τις ομάδες υπολογισμού, τις παραμέτρους what-if και τις παραμέτρους πεδίων, οι οποίες δημιουργούν έμμεσα υπολογιζόμενους πίνακες | Όχι | Όχι – οι υπολογιζόμενοι πίνακες χρησιμοποιούν τη λειτουργία αποθήκευσης "Εισαγωγή" ακόμα και όταν αναφέρονται σε άλλους πίνακες σε λειτουργία DirectQuery |
Υπολογιζόμενες στήλες | Όχι | Όχι | Όχι |
Υβριδικοί πίνακες | Όχι | Όχι | Όχι |
Διαμερίσματα πίνακα μοντέλου | Όχι – ωστόσο, ο διαμερισμό μπορεί να γίνει σε επίπεδο πίνακα Delta | Ναι – είτε θα δημιουργηθεί αυτόματα με επαυξητική ανανέωση είτε θα δημιουργηθεί με μη αυτόματο τρόπο χρησιμοποιώντας το τελικό σημείο XMLA | Όχι |
Συναθροίσεις που ορίζονται από τον χρήστη | Όχι | Όχι | Όχι |
Ασφάλεια σε επίπεδο αντικειμένου ανάλυσης SQL ή ασφάλεια σε επίπεδο στηλών | Ναι – αλλά τα ερωτήματα θα επιστρέψουν στη λειτουργία DirectQuery και ενδέχεται να προκαλέσουν σφάλματα όταν δεν επιτρέπεται το δικαίωμα | Ναι – αλλά πρέπει να αναπαράγουν δικαιώματα με ασφάλεια σε επίπεδο αντικειμένου μοντέλου σημασιολογίας | Ναι – αλλά τα ερωτήματα μπορεί να δημιουργούν σφάλματα όταν δεν επιτρέπεται το δικαίωμα |
Ασφάλεια σε επίπεδο γραμμών ανάλυσης SQL (RLS) | Ναι – αλλά τα ερωτήματα θα επιστρέψουν στη λειτουργία DirectQuery | Ναι – αλλά πρέπει να αναπαράγουν δικαιώματα με RLS σημασιολογικού μοντέλου | Όχι |
Σημασιολογικό μοντέλο ασφάλειας σε επίπεδο γραμμών (RLS) | Ναι – ωστόσο συνιστάται ιδιαίτερα να χρησιμοποιήσετε μια σταθερή σύνδεση cloud ταυτότητας | Όχι | Όχι |
Ασφάλεια σε επίπεδο αντικειμένου μοντέλου σημασιολογίας (OLS) | Όχι | Όχι | Όχι |
Μεγάλοι όγκοι δεδομένων χωρίς απαίτηση ανανέωσης | Όχι | Λιγότερο κατάλληλο – ενδέχεται να απαιτείται μεγαλύτερο μέγεθος εκχωρημένων πόρων για την υποβολή ερωτημάτων και την ανανέωση | Όχι |
Μείωση λανθάνοντος χρόνου δεδομένων | Ναι – όταν είναι ενεργοποιημένες οι αυτόματες ενημερώσεις ή η επανασχεδευση μέσω προγραμματισμού, ωστόσο, η προετοιμασία δεδομένων πρέπει να γίνει πρώτα στο upstream | Όχι | Όχι |
1 Δεν μπορείτε να συνδυάσετε πίνακες λειτουργίας αποθήκευσης Direct Lake με πίνακες λειτουργίας αποθήκευσης DirectQuery ή διπλής λειτουργίας αποθήκευσης στο ίδιο σημασιολογικό μοντέλο. Ωστόσο, μπορείτε να χρησιμοποιήσετε το Power BI Desktop για να δημιουργήσετε ένα σύνθετο μοντέλο σε ένα σημασιολογικό μοντέλο Direct Lake και, στη συνέχεια, να το επεκτείνετε με νέους πίνακες (χρησιμοποιώντας τις λειτουργίες εισαγωγής, DirectQuery ή διπλής αποθήκευσης) ή υπολογισμούς. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Δημιουργία ενός σύνθετου μοντέλου σε ένα μοντέλο σημασιολογίας.