Εκμάθηση Lakehouse: Πρόσληψη δεδομένων στο lakehouse
Σε αυτό το εκπαιδευτικό βοήθημα, θα αποκτήσετε πιο διαστατικούς πίνακες και πίνακες δεδομένων από τους εισαγωγείς του Wide World (WWI) στο lakehouse.
Προαπαιτούμενα στοιχεία
- Εάν δεν έχετε ένα lakehouse, πρέπει να δημιουργήσετε ένα lakehouse.
Λήψη δεδομένων
Σε αυτή την ενότητα, θα χρησιμοποιήσετε τη δραστηριότητα Αντιγραφή δεδομένων της διοχέτευσης Data Factory για την πρόσληψη δείγματος δεδομένων από έναν λογαριασμό χώρου αποθήκευσης Azure στην ενότητα Αρχεία της λίμνης που δημιουργήσατε προηγουμένως.
Επιλέξτε Χώροι εργασίας στο αριστερό παράθυρο περιήγησης και, στη συνέχεια, επιλέξτε τον νέο χώρο εργασίας σας από το μενού Χώροι εργασίας. Εμφανίζεται η προβολή στοιχείων του χώρου εργασίας σας.
Από την επιλογή νέο στοιχείο στην κορδέλα χώρου εργασίας, επιλέξτε Διοχέτευση δεδομένων.
Στο παράθυρο διαλόγου Νέα διοχέτευση, καθορίστε το όνομα ως IngestDataFromSourceToLakehouse και επιλέξτε Δημιουργία. Δημιουργείται και ανοίγει μια νέα διοχέτευση εργοστασίου δεδομένων.
Στη συνέχεια, ρυθμίστε μια σύνδεση HTTP για την εισαγωγή του δείγματος δεδομένων World Wide Importers στο Lakehouse. Από τη λίστα Νέες προελεύσεις, επιλέξτε Προβολή περισσότερων, αναζητήστε http και επιλέξτε το.
Στο παράθυρο Σύνδεση σε προέλευση δεδομένων, εισαγάγετε τις λεπτομέρειες από τον παρακάτω πίνακα και επιλέξτε Επόμενο.
Ιδιότητα Τιμή URL https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
Connection Δημιουργία μιας νέας σύνδεσης Όνομα σύνδεσης wwisampledata Πύλη δεδομένων Κανένα Είδος ελέγχου ταυτότητας Ανώνυμο Στο επόμενο βήμα, ενεργοποιήστε το δυαδικό αντίγραφο και επιλέξτε ZipDeflate (.zip) ως τύπο συμπίεσης, δεδομένου ότι η προέλευση είναι ένα αρχείο .zip. Διατηρήστε τα άλλα πεδία στις προεπιλεγμένες τιμές τους και κάντε κλικ στο κουμπί Επόμενο.
Στο παράθυρο Σύνδεση στον προορισμό δεδομένων, καθορίστε τον ριζικό φάκελο ως αρχεία και κάντε κλικ στο κουμπί Επόμενο. Αυτό θα γράψει τα δεδομένα στο τμήμα Αρχεία του lakehouse.
Επιλέξτε τη Μορφή αρχείου ως δυαδική για τον προορισμό. Κάντε κλικ στο κουμπί Επόμενο και, στη συνέχεια, επιλέξτε Αποθήκευση+Εκτέλεση. Μπορείτε να προγραμματίσετε τις διοχετεύσεις για περιοδική ανανέωση δεδομένων. Σε αυτή την εκμάθηση, θα εκτελέσουμε τη διοχέτευση μόνο μία φορά. Η διαδικασία αντιγραφής δεδομένων απαιτεί περίπου 10-15 λεπτά για να ολοκληρωθεί.
Μπορείτε να παρακολουθείτε την εκτέλεση και τη δραστηριότητα της διοχέτευσης στην καρτέλα Έξοδος . Μπορείτε επίσης να δείτε λεπτομερείς πληροφορίες μεταφοράς δεδομένων επιλέγοντας το εικονίδιο με τα γυαλιά δίπλα στο όνομα της διοχέτευσης, το οποίο εμφανίζεται όταν τοποθετείτε τον δείκτη επάνω στο όνομα.
Μετά την επιτυχή εκτέλεση της διοχέτευσης, μεταβείτε στο lakehouse (wwilakehouse) και ανοίξτε την εξερεύνηση για να δείτε τα δεδομένα που έχουν εισαχθεί.
Επαληθεύστε ότι ο φάκελος WideWorldImportersDW υπάρχει στην προβολή Explorer και περιέχει δεδομένα για όλους τους πίνακες.
Τα δεδομένα δημιουργούνται στην ενότητα Αρχεία της εξερεύνησης lakehouse. Ένας νέος φάκελος με GUID περιέχει όλα τα απαραίτητα δεδομένα. Μετονομασία του GUID σε μη επεξεργασμένα δεδομένα
Για να φορτώσετε επαυξητικά δεδομένα σε μια λίμνη, ανατρέξτε στο θέμα Επαυξητική φόρτωση δεδομένων από μια αποθήκη δεδομένων σε ένα lakehouse.