Τρόπος: Η πρόσβαση κατοπτρικά δεδομένα του Azure Cosmos DB στο Lakehouse και σημειωματάρια από το Microsoft Fabric (Προεπισκόπηση)
Σε αυτόν τον οδηγό, θα μάθετε πώς μπορείτε να αποκτήσετε πρόσβαση με κατοπτρικά δεδομένα του Azure Cosmos DB στο Lakehouse και σημειωματάρια από το Microsoft Fabric (Προεπισκόπηση).
Σημαντικό
Το κατοπτρικό αντίγραφο για το Azure Cosmos DB είναι αυτήν τη στιγμή σε προεπισκόπηση. Οι φόρτοι εργασίας παραγωγής δεν υποστηρίζονται κατά τη διάρκεια της προεπισκόπησης. Προς το παρόν, υποστηρίζονται μόνο οι λογαριασμοί Azure Cosmos DB για NoSQL.
Προαπαιτούμενα στοιχεία
- Ένας υπάρχων λογαριασμός Azure Cosmos DB για NoSQL.
- Εάν δεν έχετε μια συνδρομή Azure, δοκιμάστε το Azure Cosmos DB για δωρεάν NoSQL.
- Εάν έχετε μια υπάρχουσα συνδρομή Azure, δημιουργήστε έναν νέο λογαριασμό Azure Cosmos DB για λογαριασμό NoSQL.
- Ένα υπάρχον σύνολο εκχωρημένων πόρων Fabric. Εάν δεν έχετε ένα υπάρχον σύνολο εκχωρημένων πόρων, ξεκινήστε μια δοκιμαστική έκδοση Fabric.
- Ο λογαριασμός Azure Cosmos DB for NoSQL πρέπει να ρυθμιστεί για κατοπτρικά Fabric. Για περισσότερες πληροφορίες, ανατρέξτε στις απαιτήσεις λογαριασμού.
Φιλοδώρημα
Κατά τη διάρκεια της δημόσιας προεπισκόπησης, συνιστάται να χρησιμοποιήσετε ένα αντίγραφο δοκιμής ή ανάπτυξης των υπαρχόντων δεδομένων σας Azure Cosmos DB που μπορούν να ανακτηθούν γρήγορα από ένα αντίγραφο ασφαλείας.
Ρύθμιση κατοπτρισμού και προαπαιτούμενων
Ρυθμίστε τις παραμέτρους κατοπτρισμού για τη βάση δεδομένων Azure Cosmos DB for NoSQL. Εάν δεν είστε βέβαιοι για τον τρόπο ρύθμισης παραμέτρων κατοπτρισμού, ανατρέξτε στο εκπαιδευτικό βοήθημα ρύθμισης παραμέτρων βάσης δεδομένων κατοπτρισμού.
Μεταβείτε στην πύλη Fabric.
Δημιουργήστε μια νέα σύνδεση και κατοπτρικό βάση δεδομένων χρησιμοποιώντας τα διαπιστευτήρια του λογαριασμού σας Azure Cosmos DB.
Περιμένετε μέχρι την αναπαραγωγή να ολοκληρωθεί το αρχικό στιγμιότυπο δεδομένων.
Πρόσβαση με κατοπτρισμού δεδομένα στο Lakehouse και σημειωματάρια
Χρησιμοποιήστε το Lakehouse για να επεκτείνετε περαιτέρω τον αριθμό των εργαλείων που μπορείτε να χρησιμοποιήσετε για να αναλύσετε τα κατοπτρικά δεδομένα Azure Cosmos DB για NoSQL. Εδώ, χρησιμοποιείτε το Lakehouse για να δημιουργήσετε ένα σημειωματάριο Spark για να υποβάλετε ερωτήματα για τα δεδομένα σας.
Μεταβείτε ξανά στην αρχική σελίδα της πύλης Fabric.
Στο μενού πλοήγησης, επιλέξτε Δημιουργία.
Επιλέξτε Δημιουργία, εντοπίστε την ενότητα Διαχείριση δεδομένων και, στη συνέχεια, επιλέξτε Lakehouse.
Εισαγάγετε ένα όνομα για το Lakehouse και, στη συνέχεια, επιλέξτε Δημιουργία.
Στη συνέχεια, επιλέξτε Λήψη δεδομένων και, στη συνέχεια , Νέα συντόμευση. Από τη λίστα επιλογών συντόμευσης, επιλέξτε Microsoft OneLake.
Επιλέξτε τη βάση δεδομένων Azure Cosmos DB με κατοπτρικό αντίγραφο για noSQL από τη λίστα των βάσεων δεδομένων κατοπτρισμού στον χώρο εργασίας Fabric σας. Επιλέξτε τους πίνακες που θα χρησιμοποιήσετε με το Lakehouse, επιλέξτε Επόμενο και, στη συνέχεια, επιλέξτε Δημιουργία.
Ανοίξτε το μενού περιβάλλοντος για τον πίνακα στο Lakehouse και επιλέξτε Νέο ή υπάρχον σημειωματάριο.
Ένα νέο σημειωματάριο ανοίγει αυτόματα και φορτώνει ένα πλαίσιο δεδομένων χρησιμοποιώντας το
SELECT LIMIT 1000
.Εκτελέστε ερωτήματα όπως
SELECT *
χρησιμοποιώντας το Spark.df = spark.sql("SELECT * FROM Lakehouse.OrdersDB_customers LIMIT 1000") display(df)
Σημείωμα
Αυτό το παράδειγμα προϋποθέτει το όνομα του πίνακά σας. Χρησιμοποιήστε τον δικό σας πίνακα κατά τη σύνταξη του ερωτήματος Spark.
Επαναφορά εγγραφής χρησιμοποιώντας το Spark
Τέλος, μπορείτε να χρησιμοποιήσετε κώδικα Spark και Python για να γράψετε δεδομένα στον λογαριασμό σας Azure Cosmos DB προέλευσης από σημειωματάρια στο Fabric. Μπορεί να θέλετε να το κάνετε αυτό για να γράψετε ξανά τα αναλυτικά αποτελέσματα στο Cosmos DB, το οποίο μπορεί έπειτα να χρησιμοποιηθεί ως επίπεδο εξυπηρέτησης για εφαρμογές OLTP.
Δημιουργήστε τέσσερα κελιά κώδικα στο σημειωματάριό σας.
Πρώτα, υποβάλετε ερωτήματα για τα δεδομένα κατοπτρισμού σας.
fMirror = spark.sql("SELECT * FROM Lakehouse1.OrdersDB_ordercatalog")
Φιλοδώρημα
Τα ονόματα πινάκων σε αυτά τα δείγματα μπλοκ κώδικα υποθέτουν ένα συγκεκριμένο σχήμα δεδομένων. Μην διστάσετε να το αντικαταστήσετε με τα δικά σας ονόματα πινάκων και στηλών.
Τώρα, μετασχηματίστε και συγκεντρώστε τα δεδομένα.
dfCDB = dfMirror.filter(dfMirror.categoryId.isNotNull()).groupBy("categoryId").agg(max("price").alias("max_price"), max("id").alias("id"))
Στη συνέχεια, ρυθμίστε τις παραμέτρους του Spark για εγγραφή ξανά στον λογαριασμό σας Azure Cosmos DB for NoSQL χρησιμοποιώντας τα διαπιστευτήρια, το όνομα βάσης δεδομένων και το όνομα κοντέινερ.
writeConfig = { "spark.cosmos.accountEndpoint" : "https://xxxx.documents.azure.com:443/", "spark.cosmos.accountKey" : "xxxx", "spark.cosmos.database" : "xxxx", "spark.cosmos.container" : "xxxx" }
Τέλος, χρησιμοποιήστε το Spark για να γράψετε ξανά στη βάση δεδομένων προέλευσης.
dfCDB.write.mode("APPEND").format("cosmos.oltp").options(**writeConfig).save()
Εκτελέστε όλα τα κελιά κώδικα.
Σημαντικό
Οι λειτουργίες εγγραφής στο Azure Cosmos DB θα καταναλώνουν μονάδες αίτησης (RUs).