แชร์ผ่าน


บทช่วยสอนสําหรับเลคเฮ้าส์: การนําเข้าข้อมูลลงในเลคเฮ้าส์

ในบทช่วยสอนนี้ คุณจะนําเข้าตารางที่มีมิติและข้อเท็จจริงเพิ่มเติมจากตัวนําเข้า Wide World (WWI) ลงในเลคเฮ้าส์

ข้อกำหนดเบื้องต้น

นำเข้าข้อมูล

ในส่วนนี้ คุณใช้ กิจกรรม คัดลอกข้อมูลของไปป์ไลน์ Data Factory เพื่อนําเข้าข้อมูลตัวอย่างจากบัญชีเก็บข้อมูล Azure ไปยัง ส่วนไฟล์ ของ lakehouse ที่คุณสร้างไว้ก่อนหน้านี้

  1. เลือก พื้นที่ทํางาน ในบานหน้าต่างนําทางด้านซ้าย จากนั้นเลือกพื้นที่ทํางานใหม่ของคุณจากเมนู พื้นที่ทํางาน มุมมองหน่วยข้อมูลของพื้นที่ทํางานของคุณจะปรากฏขึ้น

  2. จากรายการเมนู +ใหม่ ในริบบอนพื้นที่ทํางาน ให้เลือก ไปป์ไลน์ข้อมูล

    สกรีนช็อตแสดงวิธีการสร้างไปป์ไลน์ข้อมูลใหม่

  3. ในกล่องโต้ตอบ สร้างไปป์ไลน์ ให้ระบุชื่อเป็น IngestDataFromSourceToLakehouse และเลือก สร้าง มีการสร้างและเปิดไปป์ไลน์โรงงานข้อมูลใหม่

  4. ถัดไป ตั้งค่าการเชื่อมต่อ HTTP เพื่อนําเข้าตัวอย่างข้อมูล World Wide Importers ไปยังเลคเฮ้าส์ จากรายการของ แหล่งข้อมูลใหม่ ให้เลือก ดูเพิ่มเติม ค้นหา Http และเลือก

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกแหล่งข้อมูล HTTP

  5. ในหน้าต่างเชื่อมต่อกับแหล่งข้อมูล ให้ใส่รายละเอียดจากตารางด้านล่างและเลือก ถัดไป

    คุณสมบัติ ค่า
    URL https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
    Connection สร้างการเชื่อมต่อใหม่
    ชื่อการเชื่อมต่อ wwisampledata
    เกตเวย์ข้อมูล None
    ชนิดของการรับรองความถูกต้อง ไม่ระบุชื่อ

    สกรีนช็อตที่แสดงพารามิเตอร์เพื่อกําหนดค่าการเชื่อมต่อ Http

  6. ในขั้นตอนถัดไป เปิดใช้งาน สําเนา ไบนารีและเลือก ZipDeflate (.zip) เป็น ชนิด การบีบอัด เนื่องจากแหล่งที่มาเป็นไฟล์.zip เก็บเขตข้อมูลอื่นที่ค่าเริ่มต้นของเขตข้อมูลนั้น แล้วคลิกถัดไป

    สกรีนช็อตที่แสดงวิธีการเลือกชนิดการบีบอัด

  7. ในหน้าต่างเชื่อมต่อกับปลายทางข้อมูล ระบุโฟลเดอร์รากเป็นไฟล์และคลิกถัดไป ซึ่งจะเขียนข้อมูลไปยังส่วน ไฟล์ ของเลคเฮ้าส์

    สกรีนช็อตแสดงการตั้งค่าการเชื่อมต่อปลายทางของเลคเฮ้าส์

  8. เลือก รูปแบบไฟล์ เป็น ไบนารี สําหรับปลายทาง คลิก ถัดไป แล้วเลือก บันทึก + เรียกใช้ คุณสามารถกําหนดตารางเวลาไปป์ไลน์เพื่อรีเฟรชข้อมูลเป็นระยะๆ ในบทช่วยสอนนี้ เราจะเรียกใช้ไปป์ไลน์เพียงครั้งเดียวเท่านั้น กระบวนการคัดลอกข้อมูลจะใช้เวลาประมาณ 10-15 นาทีในการดําเนินการให้เสร็จสมบูรณ์

    สกรีนช็อตที่แสดงรูปแบบไฟล์ปลายทาง

  9. คุณสามารถตรวจสอบการดําเนินการและกิจกรรมของไปป์ไลน์ได้ในแท็บ เอาต์พุต นอกจากนี้คุณยังสามารถดูข้อมูลถ่ายโอนข้อมูลโดยละเอียดโดยการเลือกไอคอนแว่นตาถัดจากชื่อไปป์ไลน์ซึ่งปรากฏขึ้นเมื่อคุณโฮเวอร์เหนือชื่อ

    สกรีนช็อตแสดงสถานะของกิจกรรมการคัดลอกไปป์ไลน์

  10. หลังจากการดําเนินการของไปป์ไลน์สําเร็จให้ไปที่เลคเฮ้าส์ของคุณ (wwilakehouse) และเปิด explorer เพื่อดูข้อมูลที่นําเข้า

    สกรีนช็อตแสดงวิธีการนําทางไปยังเลคเฮ้าส์

  11. ตรวจสอบว่าโฟลเดอร์ WideWorldImportersDW ปรากฏอยู่ใน มุมมอง Explorer และมีข้อมูลสําหรับตารางทั้งหมด

    สกรีนช็อตที่แสดงข้อมูลต้นฉบับถูกคัดลอกลงใน Lakehouse explorer

  12. ข้อมูลถูกสร้างขึ้นภายใต้ส่วน ไฟล์ ของ lakehouse explorer โฟลเดอร์ใหม่ที่มี GUID ประกอบด้วยข้อมูลที่จําเป็นทั้งหมด เปลี่ยนชื่อ GUID เป็น wwi-raw-data

หากต้องการโหลดข้อมูลแบบเพิ่มหน่วยลงในเลคเฮ้าส์ โปรดดู โหลดข้อมูลจากคลังข้อมูลไปยังเลคเฮ้าส์แบบเพิ่มหน่วย

ขั้นตอนถัดไป