Επιτάχυνση ερωτημάτων για συντομεύσεις OneLake - επισκόπηση (προεπισκόπηση)
Οι συντομεύσεις OneLake είναι αναφορές από μια Eventhouse που παραπέμπει σε εσωτερικές προελεύσεις Fabric ή εξωτερικές προελεύσεις. Αυτό το είδος συντόμευσης θα προσπελαστεί αργότερα για το ερώτημα σε σύνολα ερωτημάτων KQL χρησιμοποιώντας τη external_table()
συνάρτηση. Τα ερωτήματα που εκτελούνται σε συντομεύσεις OneLake μπορεί να είναι λιγότερο αποδοτικά σε σχέση με τα δεδομένα που προσλαμβάνεται απευθείας στο Eventhouses λόγω διαφόρων παραγόντων, όπως οι κλήσεις δικτύου για τη λήψη δεδομένων από τον χώρο αποθήκευσης, η απουσία ευρετηρίων και πολλά άλλα.
Η επιτάχυνση ερωτημάτων επιτρέπει τον καθορισμό μιας πολιτικής επιπλέον των εξωτερικών πινάκων δέλτα, η οποία ορίζει τον αριθμό των ημερών για την προσωρινή αποθήκευση δεδομένων για ερωτήματα υψηλών επιδόσεων.
Η επιτάχυνση ερωτημάτων υποστηρίζεται στο Eventhouse σε πίνακες δέλτα από συντομεύσεις OneLake, Azure Data Lake Store Gen1, Amazon S3, Υπηρεσίες Cloud Google, εξωτερικούς πίνακες αποθήκευσης αντικειμένων blob Azure και όλους τους προορισμούς που υποστηρίζονται από συντομεύσεις OneLake.
Σημαντικό
Αυτή η δυνατότητα είναι σε προεπισκόπηση.
Σημείωμα
Εάν έχετε ζητήματα συμμόρφωσης που απαιτούν την αποθήκευση δεδομένων σε μια συγκεκριμένη περιοχή, βεβαιωθείτε ότι οι εκχωρημένοι πόροι της υπηρεσίας συμβάντων είναι στην ίδια περιοχή με τον εξωτερικό πίνακα ή τα δεδομένα συντόμευσης.
Επιταχυνόμενοι εξωτερικοί πίνακες προστίθενται στον χώρο αποθήκευσης COGS και στην κατανάλωση χώρου αποθήκευσης SSD από το Eventhouse, όμοια με τους κανονικούς πίνακες στη βάση δεδομένων KQL. Μπορείτε να ελέγξετε την ποσότητα των δεδομένων στο cache, ορίζοντας την ιδιότητα Hot στην πολιτική επιτάχυνσης ερωτήματος. Η δραστηριότητα δημιουργίας ευρετηρίου και πρόσληψης συμβάλλει επίσης στη χρήση υπολογιστικών πόρων.
Πότε πρέπει να χρησιμοποιήσω την επιτάχυνση ερωτημάτων για συντομεύσεις OneLake;
Η επιτάχυνση ερωτημάτων αποθηκεύει στο cache δεδομένα καθώς βρίσκονται στο OneLake, παρέχοντας επιδόσεις συγκρίσιμες με την πρόσληψη δεδομένων στην Eventhouse. Χρησιμοποιώντας αυτήν τη δυνατότητα, μπορείτε να επιταχύνετε την προορισμού δεδομένων στο OneLake, συμπεριλαμβανομένων υπαρχόντων δεδομένων και τυχόν νέων ενημερώσεων και να περιμένετε παρόμοιες επιδόσεις. Αυτό εξαλείφει την ανάγκη διαχείρισης διοχετεύσεων πρόσληψης, διατηρεί διπλότυπα αντίγραφα δεδομένων, εξασφαλίζοντας παράλληλα ότι τα δεδομένα παραμένουν συγχρονισμένα χωρίς επιπλέον προσπάθεια.
Τα παρακάτω σενάρια είναι ιδανικά για τη χρήση της επιτάχυνσης ερωτημάτων σε συντομεύσεις OneLake:
- Υποβολή ερωτημάτων σε OneLake με υψηλές επιδόσεις: Όταν έχετε υπάρχοντες φόρτους εργασίας που αποστέλλουν δεδομένα και τα διαχειρίζονται στον χώρο αποθήκευσης (προαιρετικά σε ένα διαφορετικό cloud ή περιοχή) και θέλετε να υποβάλετε ερωτήματα σε ορισμένα ή σε όλα τα δεδομένα με υψηλές επιδόσεις.
- Συνδυασμός ιστορικών δεδομένων με ροές σε πραγματικό χρόνο: Όταν θέλετε να συνδυάσετε απρόσκοπτα την προσγείωση δεδομένων στο OneLake απευθείας με ροές σε πραγματικό χρόνο που εισέρχονται στο Eventhouse χωρίς να διακυβεύεται η ταχύτητα των ερωτημάτων.
- Αξιοποίηση δεδομένων διαστάσεων διαχειριζόμενων από άλλα στοιχεία: Συχνά, δεδομένα υψηλής τιμής και μικρού όγκου φιλοξενούνται σε διακομιστές SQL, Cosmos DB, Snowflake ή άλλα συστήματα που μπορούν να αντικατοπτριστούν στο OneLake. Οι επιταχυμένες συντομεύσεις OneLake μπορούν να κάνουν αυτά τα δεδομένα εύκολα αναλώσιμα για συνδέσμους και εμπλουτισμό στο ερώτημα Eventhouse. Καθώς τα δεδομένα διάστασης είναι συχνά σημαντικά μικρότερα από τα δεδομένα δραστηριότητας, το πρόσθετο κόστος που σχετίζεται με αυτή τη χρήση είναι συνήθως ελάχιστο.
Συμπεριφορά επιταχυμένων εξωτερικών πινάκων δέλτα
Οι επιταχυμένες συντομεύσεις OneLake συμπεριφέρονται όπως οι εξωτερικοί πίνακες, με τους ίδιους περιορισμούς και δυνατότητες. Συγκεκριμένα, δεν υποστηρίζονται δυνατότητες όπως υλοποιημένες πολιτικές προβολής και ενημέρωσης.
Παρακολούθηση συμπεριφοράς επιτάχυνσης
Η αρχική διαδικασία επιτάχυνσης ερωτήματος εξαρτάται από το μέγεθος του εξωτερικού πίνακα. Για να παρακολουθήσετε την πρόοδο και τις ρυθμίσεις ενός επιταχυνόμενου πίνακα, χρησιμοποιήστε την εντολή .show external table operations query_acceleration statistics σε ένα σύνολο ερωτημάτων KQL.
Περιορισμοί
- Ο αριθμός των στηλών στον εξωτερικό πίνακα δεν μπορεί να υπερβεί το 900.
- Η απόδοση ερωτημάτων σε επιταχυνόμενους εξωτερικούς πίνακες δέλτα που έχουν διαμερίσματα ενδέχεται να μην είναι η βέλτιστη κατά τη διάρκεια της προεπισκόπησης.
- Η δυνατότητα προϋποθέτει πίνακες δέλτα με στατικές προηγμένες δυνατότητες, για παράδειγμα, η αντιστοίχιση στηλών δεν αλλάζει, τα διαμερίσματα δεν αλλάζουν και ούτω καθεξής. Για να αλλάξετε τις προηγμένες δυνατότητες, απενεργοποιήστε πρώτα την πολιτική και, μόλις πραγματοποιηθεί η αλλαγή, ενεργοποιήστε ξανά την πολιτική.
- Οι αλλαγές σχήματος στον πίνακα δέλτα πρέπει επίσης να ακολουθούνται με το αντίστοιχο
.alter
σχήμα εξωτερικού πίνακα δέλτα, το οποίο μπορεί να οδηγήσει σε επιτάχυνση που ξεκινά από την αρχή εάν υπήρχε αλλαγή σχήματος διακοπής. - Το κλάδεμα βάσει ευρετηρίου δεν υποστηρίζεται για διαμερίσματα.
- Τα αρχεία Parquet με συμπιεσμένο μέγεθος μεγαλύτερο από 6 GB δεν θα αποθηκεύονται στο cache.
Χρέωση
Τα επιταχυντικά δεδομένα χρεώνονται στον μετρητή cache OneLake Premium, όμοια με τους εγγενείς πίνακες Eventhouse. Μπορείτε να ελέγξετε την ποσότητα των δεδομένων που επιταχύνονται ρυθμίζοντας τον αριθμό των ημερών στο cache. Η δραστηριότητα δημιουργίας ευρετηρίου μπορεί επίσης να προσμετράται στην κατανάλωση CU. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Χρέωση χώρου αποθήκευσης.
Οι χρεώσεις που σχετίζονται με την επιτάχυνση του ερωτήματος θα εμφανίζονται στην εφαρμογή Μετρικά Fabric στην περιοχή Eventhouse όπου δημιουργείται η επιταχυνόμενη συντόμευση.