Κοινή χρήση μέσω


Εκμάθηση Lakehouse: Πρόσληψη δεδομένων στο lakehouse

Σε αυτό το εκπαιδευτικό βοήθημα, θα αποκτήσετε πιο διαστατικούς πίνακες και πίνακες δεδομένων από τους εισαγωγείς του Wide World (WWI) στο lakehouse.

Προαπαιτούμενα στοιχεία

Λήψη δεδομένων

Σε αυτή την ενότητα, θα χρησιμοποιήσετε τη δραστηριότητα Αντιγραφή δεδομένων της διοχέτευσης Data Factory για την πρόσληψη δείγματος δεδομένων από έναν λογαριασμό χώρου αποθήκευσης Azure στην ενότητα Αρχεία της λίμνης που δημιουργήσατε προηγουμένως.

  1. Επιλέξτε Χώροι εργασίας στο αριστερό παράθυρο περιήγησης και, στη συνέχεια, επιλέξτε τον νέο χώρο εργασίας σας από το μενού Χώροι εργασίας. Εμφανίζεται η προβολή στοιχείων του χώρου εργασίας σας.

  2. Από την επιλογή νέο στοιχείο στην κορδέλα χώρου εργασίας, επιλέξτε Διοχέτευση δεδομένων.

  3. Στο παράθυρο διαλόγου Νέα διοχέτευση, καθορίστε το όνομα ως IngestDataFromSourceToLakehouse και επιλέξτε Δημιουργία. Δημιουργείται και ανοίγει μια νέα διοχέτευση εργοστασίου δεδομένων.

  4. Στη συνέχεια, ρυθμίστε μια σύνδεση HTTP για την εισαγωγή του δείγματος δεδομένων World Wide Importers στο Lakehouse. Από τη λίστα Νέες προελεύσεις, επιλέξτε Προβολή περισσότερων, αναζητήστε http και επιλέξτε το.

    Στιγμιότυπο οθόνης που εμφανίζει πού μπορείτε να επιλέξετε την προέλευση HTTP.

  5. Στο παράθυρο Σύνδεση σε προέλευση δεδομένων, εισαγάγετε τις λεπτομέρειες από τον παρακάτω πίνακα και επιλέξτε Επόμενο.

    Ιδιότητα Τιμή
    URL https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
    Connection Δημιουργία μιας νέας σύνδεσης
    Όνομα σύνδεσης wwisampledata
    Πύλη δεδομένων Κανένα
    Είδος ελέγχου ταυτότητας Ανώνυμο

    Στιγμιότυπο οθόνης που εμφανίζει τις παραμέτρους για τη ρύθμιση της σύνδεσης Http.

  6. Στο επόμενο βήμα, ενεργοποιήστε το δυαδικό αντίγραφο και επιλέξτε ZipDeflate (.zip) ως τύπο συμπίεσης, δεδομένου ότι η προέλευση είναι ένα αρχείο .zip. Διατηρήστε τα άλλα πεδία στις προεπιλεγμένες τιμές τους και κάντε κλικ στο κουμπί Επόμενο.

    Στιγμιότυπο οθόνης που δείχνει πώς μπορείτε να επιλέξετε έναν τύπο συμπίεσης.

  7. Στο παράθυρο Σύνδεση στον προορισμό δεδομένων, καθορίστε τον ριζικό φάκελο ως αρχεία και κάντε κλικ στο κουμπί Επόμενο. Αυτό θα γράψει τα δεδομένα στο τμήμα Αρχεία του lakehouse.

    Στιγμιότυπο οθόνης που εμφανίζει τις ρυθμίσεις σύνδεσης προορισμού του lakehouse.

  8. Επιλέξτε τη Μορφή αρχείου ως δυαδική για τον προορισμό. Κάντε κλικ στο κουμπί Επόμενο και, στη συνέχεια, επιλέξτε Αποθήκευση+Εκτέλεση. Μπορείτε να προγραμματίσετε τις διοχετεύσεις για περιοδική ανανέωση δεδομένων. Σε αυτή την εκμάθηση, θα εκτελέσουμε τη διοχέτευση μόνο μία φορά. Η διαδικασία αντιγραφής δεδομένων απαιτεί περίπου 10-15 λεπτά για να ολοκληρωθεί.

    Στιγμιότυπο οθόνης που εμφανίζει τη μορφή αρχείου προορισμού.

  9. Μπορείτε να παρακολουθείτε την εκτέλεση και τη δραστηριότητα της διοχέτευσης στην καρτέλα Έξοδος . Μπορείτε επίσης να δείτε λεπτομερείς πληροφορίες μεταφοράς δεδομένων επιλέγοντας το εικονίδιο με τα γυαλιά δίπλα στο όνομα της διοχέτευσης, το οποίο εμφανίζεται όταν τοποθετείτε τον δείκτη επάνω στο όνομα.

    Στιγμιότυπο οθόνης που εμφανίζει την κατάσταση της δραστηριότητας αντιγραφής διοχέτευσης.

  10. Μετά την επιτυχή εκτέλεση της διοχέτευσης, μεταβείτε στο lakehouse (wwilakehouse) και ανοίξτε την εξερεύνηση για να δείτε τα δεδομένα που έχουν εισαχθεί.

    Στιγμιότυπο οθόνης που δείχνει πώς μπορείτε να περιηγηθείτε στο lakehouse.

  11. Επαληθεύστε ότι ο φάκελος WideWorldImportersDW υπάρχει στην προβολή Explorer και περιέχει δεδομένα για όλους τους πίνακες.

    Στιγμιότυπο οθόνης που εμφανίζει τα δεδομένα προέλευσης που αντιγράφονται στην εξερεύνηση Lakehouse.

  12. Τα δεδομένα δημιουργούνται στην ενότητα Αρχεία της εξερεύνησης lakehouse. Ένας νέος φάκελος με GUID περιέχει όλα τα απαραίτητα δεδομένα. Μετονομασία του GUID σε μη επεξεργασμένα δεδομένα

Για να φορτώσετε επαυξητικά δεδομένα σε μια λίμνη, ανατρέξτε στο θέμα Επαυξητική φόρτωση δεδομένων από μια αποθήκη δεδομένων σε ένα lakehouse.

Επόμενο βήμα