สถานการณ์การกําหนดราคาโดยใช้กระแสข้อมูล Gen2 เพื่อโหลดข้อมูล Parquet 2 GB ไปยังตาราง Lakehouse
ในสถานการณ์นี้ กระแสข้อมูล Gen2 ถูกใช้เพื่อโหลดข้อมูล Parquet 2 GB ที่จัดเก็บไว้ใน Azure Data Lake Storage (ADLS) Gen2 ไปยังตาราง Lakehouse ใน Microsoft Fabric เราใช้ข้อมูลตัวอย่างสีเขียวของ NYC Taxi สําหรับข้อมูล Parquet
ราคาที่ใช้ในตัวอย่างต่อไปนี้เป็นการสมมติขึ้นและไม่ได้ตั้งใจจะหมายถึงการกําหนดราคาจริงที่แน่นอน ต่อไปนี้เป็นเพียงการสาธิตวิธีการที่คุณสามารถประมาณ วางแผน และจัดการค่าใช้จ่ายสําหรับโครงการ Data Factory ใน Microsoft Fabric นอกจากนี้เนื่องจากความจุ Fabric มีราคาเฉพาะในแต่ละภูมิภาค เราจึงใช้การกําหนดราคาแบบจ่ายตามการใช้งานจริงสําหรับความจุ Fabric ที่ US West 2 (ภูมิภาค Azure ทั่วไป) อยู่ที่ $0.18 ต่อ CU ต่อชั่วโมง ดูที่ Microsoft Fabric - ราคา เพื่อสํารวจตัวเลือกการกําหนดราคา Fabric อื่น ๆ
การกำหนดค่า
หากต้องการทําสถานการณ์นี้ให้สําเร็จ คุณต้องสร้างกระแสข้อมูลด้วยขั้นตอนต่อไปนี้:
- เริ่มต้นกระแสข้อมูล: รับข้อมูลไฟล์ Parquet 2 GB จากบัญชีที่เก็บข้อมูล ADLS Gen2
- กําหนดค่า Power Query:
- นําทางไปยัง Power Query
- ตรวจสอบให้แน่ใจว่ามีการเปิดใช้งานตัวเลือกสําหรับการจัดเตรียมคิวรี
- ดําเนินการรวมไฟล์ Parquet
- การแปลงข้อมูล:
- เลื่อนระดับส่วนหัวเพื่อความชัดเจน
- ลบคอลัมน์ที่ไม่จําเป็นออก
- ปรับชนิดข้อมูลคอลัมน์ตามความจําเป็น
- กําหนดปลายทางของข้อมูลผลลัพธ์:
- กําหนดค่าของเลคเฮ้าส์เป็นปลายทางผลลัพธ์ข้อมูล
- ในตัวอย่างนี้ มีการสร้างและใช้งานเลคเฮ้าส์ภายใน Fabric
การประมาณค่าใช้จ่ายโดยใช้แอปการวัด Fabric
ตัววัดการคํานวณกระแสข้อมูลระดับสูงบันทึกกิจกรรมที่ละเลยได้ ตัววัดการคํานวณมาตรฐานสําหรับการดําเนินการรีเฟรชกระแสข้อมูล Gen2 ใช้หน่วยคํานวณ 112,098.540 หน่วย (CUs) สิ่งสําคัญคือต้องพิจารณาว่าการดําเนินการอื่น ๆ รวมถึง Warehouse Query, SQL Endpoint Query และ Dataset On-Demand Refresh ซึ่งเป็นลักษณะโดยละเอียดของการใช้งาน Dataflow Gen2 ที่โปร่งใสและจําเป็นสําหรับการดําเนินการที่เกี่ยวข้องในปัจจุบัน อย่างไรก็ตาม การดําเนินการเหล่านี้จะถูกมองไม่เห็นในการอัปเดตในอนาคต และควรละเว้นเมื่อประเมินค่าใช้จ่ายสําหรับ Dataflow Gen2
หมายเหตุ
แม้ว่ารายงานเป็นเมตริก แต่ระยะเวลาที่แท้จริงของการเรียกใช้ไม่เกี่ยวข้องเมื่อคํานวณชั่วโมง CU ที่มีประสิทธิภาพด้วยแอปเมตริก Fabric ตั้งแต่เมตริก CU วินาทีและยังรายงานบัญชีอยู่แล้วสําหรับระยะเวลา
Metric | การคํานวณมาตรฐาน | การคํานวณระดับสูง |
---|---|---|
วินาที CU ทั้งหมด | 112,098.54 CU วินาที | 0 CU วินาที |
เรียกเก็บเงิน CU-ชั่วโมงที่มีประสิทธิภาพ | 112,098.54 / (60*60) = 31.14 CU ชั่วโมง | 0 / (60*60) = 0 ชั่วโมงคิว |
ต้นทุนการเรียกใช้ทั้งหมดที่ $0.18/CU ชั่วโมง = (31.14 CU-ชั่วโมง) * ($0.18/CU ชั่วโมง) ~ = $5.60