สถานการณ์การใช้งาน Power BI: การเตรียมข้อมูลขั้นสูง
หมายเหตุ
บทความนี้เป็นส่วนหนึ่งของ ชุดการวางแผน การใช้งาน Power BI ของบทความ ชุดข้อมูลนี้เน้นไปที่ประสบการณ์การใช้งาน Power BI ภายใน Microsoft Fabric เป็นหลัก สําหรับบทนําสู่ชุดข้อมูล โปรดดู ที่ การวางแผนการใช้งาน Power BI
การเตรียมข้อมูล (บางครั้งเรียกว่า ETL ซึ่งเป็นตัวย่อสําหรับ กิจกรรมแยก แปลง และโหลด) มักเกี่ยวข้องกับความพยายามอย่างมาก เวลา ทักษะ และความพยายามที่เกี่ยวข้องกับการรวบรวม การทําความสะอาด การรวม และการเพิ่มข้อมูลขึ้นอยู่กับคุณภาพและโครงสร้างของข้อมูลต้นทาง
การทุ่มเทเวลาและความพยายามในการเตรียมข้อมูลแบบรวมศูนย์จะช่วย:
- เพิ่มความสามารถในการนํามาใช้ใหม่และรับค่าสูงสุดจากความพยายามในการเตรียมข้อมูล
- ปรับปรุงความสามารถในการให้ข้อมูลที่สอดคล้องกันกับหลายทีม
- ลดระดับความพยายามที่ผู้สร้างเนื้อหาคนอื่น ๆ ต้องการ
- บรรลุขนาดและประสิทธิภาพการทํางาน
สถานการณ์การใช้งานการเตรียมข้อมูลขั้นสูงขยายในสถานการณ์การเตรียมข้อมูลแบบบริการตนเอง การเตรียมข้อมูลขั้นสูงเป็นเรื่องเกี่ยวกับการเพิ่มการนํากระแสข้อมูลกลับมาใช้ใหม่โดยผู้ใช้หลายคนในทีมต่างๆ และสําหรับกรณีการใช้งานต่าง ๆ
พื้นที่ทํางานที่แยกกันซึ่งจัดระเบียบตามวัตถุประสงค์ของกระแสข้อมูลจะมีประโยชน์เมื่อมีเอาต์พุตกระแสข้อมูลให้กับผู้สร้างแบบจําลองความหมายหลายรายโดยเฉพาะอย่างยิ่งเมื่ออยู่ในทีมที่แตกต่างกันในองค์กร พื้นที่ทํางานแยกกันยังเป็นประโยชน์สําหรับการจัดการบทบาทความปลอดภัยเมื่อบุคคลที่สร้างและจัดการกระแสข้อมูลแตกต่างจากที่ผู้ใช้ใช้งาน
หมายเหตุ
สถานการณ์การเตรียมข้อมูลขั้นสูงเป็นสถานการณ์การเตรียมข้อมูลที่สอง สถานการณ์นี้สร้างขึ้นจากสิ่งที่สามารถทําได้ด้วยกระแสข้อมูลส่วนกลางตามที่อธิบายไว้ใน สถานการณ์การเตรียม ข้อมูลด้วยตนเอง
สถานการณ์การเตรียมข้อมูลขั้นสูงเป็นหนึ่งในสถานการณ์ BI แบบบริการตนเอง อย่างไรก็ตาม สมาชิกทีมแบบรวมศูนย์สามารถใช้เทคนิคในลักษณะเดียวกับที่อธิบายไว้ใน สถานการณ์ BI แบบบริการตนเองที่มีการจัดการ สําหรับรายการทั้งหมดของสถานการณ์แบบบริการตนเอง ให้ดู บทความ สถานการณ์ การใช้งาน Power BI
เพื่อความคล่องตัว หัวข้อบางแง่มุมที่อธิบายไว้ในหัวข้อการทํางานร่วมกันของ เนื้อหาและสถานการณ์ การจัดส่งนั้นไม่ครอบคลุมในบทความนี้ สําหรับความครอบคลุมที่สมบูรณ์ ให้อ่านบทความเหล่านั้นก่อน
ไดอะแกรมสถานการณ์จําลอง
เคล็ดลับ
เราขอแนะนําให้คุณตรวจสอบ สถานการณ์การใช้งานการเตรียม ข้อมูลแบบบริการตนเองหากคุณไม่คุ้นเคย สถานการณ์การเตรียมข้อมูลแบบบริการตนเองขั้นสูงจะสร้างขึ้นตามสถานการณ์นั้น
จุดมุ่งเน้นของสถานการณ์การเตรียมข้อมูลขั้นสูงนี้อยู่ที่:
- การใช้กระแสข้อมูลที่แยกต่างหากตามวัตถุประสงค์: การจัดเตรียม การแปลง หรือการสิ้นสุด เราขอแนะนําให้ใช้ แบบเอกสาร สําเร็จรูปที่แยกเป็นส่วนประกอบเพื่อให้ได้การนํากลับมาใช้ใหม่มากขึ้นในชุดค่าผสมต่าง ๆ เพื่อสนับสนุนความต้องการของผู้ใช้ที่เฉพาะเจาะจง โครงสร้างแบบเอกสารสําเร็จรูปที่แยกได้จะอธิบายไว้ในบทความนี้ในภายหลัง
- การใช้พื้นที่ทํางานแยกต่างหากที่สนับสนุนผู้สร้างกระแสข้อมูลหรือผู้บริโภคกระแสข้อมูล ผู้สร้างแบบจําลองข้อมูลที่ใช้กระแสข้อมูลอาจอยู่ในทีมต่างกันและ/หรือมีกรณีการใช้งานที่แตกต่างกัน
- การใช้ตารางที่เชื่อมโยง (หรือที่เรียกว่า เอนทิตีที่เชื่อมโยง) ตารางที่มีการคํานวณ (หรือที่เรียกว่า เอนทิตีที่คํานวณ) และกลไกการคํานวณขั้นสูง
หมายเหตุ
ในบางครั้งคําศัพท์ แบบจําลอง เชิงความหมายและ แบบจําลอง ข้อมูลจะใช้สลับกัน โดยทั่วไปแล้ว จากมุมมองของบริการของ Power BI ที่เรียกว่าแบบจําลองความหมาย จากมุมมองการพัฒนา มุมมองนี้เรียกว่า แบบจําลอง ข้อมูล (หรือ แบบจําลอง สําหรับระยะสั้น) ในบทความนี้ ทั้งสองคําศัพท์มีความหมายเหมือนกัน ในทํานองเดียวกัน ผู้สร้างแบบจําลองความหมายและผู้สร้างแบบจําลองข้อมูลมีความหมายเหมือนกัน
ไดอะแกรมต่อไปนี้แสดงภาพรวมระดับสูงของการดําเนินการของผู้ใช้ทั่วไปส่วนใหญ่และคอมโพเนนต์ของ Power BI ที่สนับสนุนสถานการณ์การเตรียมข้อมูลขั้นสูง
เคล็ดลับ
เราขอแนะนําให้คุณ ดาวน์โหลดไดอะแกรม สถานการณ์ถ้าคุณต้องการฝังลงในงานนําเสนอ เอกสารหรือบล็อกโพสต์ของคุณ หรือพิมพ์ออกมาเป็นโปสเตอร์บนผนัง เนื่องจากเป็นภาพกราฟิกเวกเตอร์ที่ปรับขนาดได้ (SVG) คุณสามารถปรับขนาดขึ้นหรือลงได้โดยไม่สูญเสียคุณภาพ
ไดอะแกรมสถานการณ์แสดงการดําเนินการ เครื่องมือ และคุณลักษณะของผู้ใช้ต่อไปนี้:
รายการ | คำอธิบาย |
---|---|
ผู้สร้างกระแสข้อมูลพัฒนาคอลเลกชันของตารางภายใน กระแสข้อมูล สําหรับกระแสข้อมูลที่มีวัตถุประสงค์เพื่อนํามาใช้ซ้ํา เป็นเรื่องปกติ (แต่ไม่จําเป็น) ที่ผู้สร้างเป็นสมาชิกของทีมส่วนกลางที่สนับสนุนผู้ใช้ข้ามขอบเขตขององค์กร (เช่น IT, BI ขององค์กร หรือ ศูนย์แห่งความเป็นเลิศ) | |
กระแสข้อมูลเชื่อมต่อกับข้อมูลจากแหล่งข้อมูลหนึ่งหรือหลายแหล่ง | |
แหล่งข้อมูลบางแหล่งอาจจําเป็นต้องใช้เกตเวย์ข้อมูลภายในองค์กรหรือเกตเวย์ VNet สําหรับการรีเฟรชข้อมูล เช่นเดียวกับที่อยู่ภายในเครือข่ายส่วนตัว เกตเวย์เหล่านี้จะใช้สําหรับการเขียนกระแสข้อมูลใน Power Query Online และการรีเฟรชกระแสข้อมูล | |
พื้นที่ทํางานทั้งหมดที่เกี่ยวข้องมีโหมดสิทธิ์การใช้งานที่ตั้งค่าเป็นความจุ Fabric, ความจุพรีเมียม, Premium Per User หรือ Embedded โหมดสิทธิ์การใช้งานเหล่านี้อนุญาตให้ใช้ตารางที่มีการเชื่อมโยงและตารางที่มีการคํานวณทั่วทั้งพื้นที่ทํางานซึ่งจําเป็นในสถานการณ์นี้ | |
ผู้สร้างกระแสข้อมูลจะพัฒนากระแสข้อมูลโดยใช้ Power Query Online ซึ่งเป็น Power Query เวอร์ชันบนเว็บ | |
กระแสข้อมูลการจัดเตรียมจะถูกสร้างขึ้นในพื้นที่ทํางานที่อุทิศให้กับการจัดการกระแสข้อมูลแบบรวมศูนย์ กระแสข้อมูลการแบ่งระยะจะคัดลอกข้อมูลดิบตามแหล่งที่มา ไม่กี่ ถ้ามี การแปลงจะถูกนําไปใช้ | |
กระแสข้อมูลการแปลง (หรือที่เรียกว่ากระแสข้อมูลที่ได้รับการทําความสะอาด) จะถูกสร้างขึ้นในพื้นที่ทํางานเดียวกัน ซึ่งเป็นแหล่งข้อมูลโดยใช้ ตาราง ที่เชื่อมโยงไปยังกระแสข้อมูลการจัดเตรียม ตาราง ที่มีการคํานวณจะรวมขั้นตอนการแปลงที่จัดเตรียม ทําความสะอาด และปรับแต่งข้อมูล | |
ผู้สร้างกระแสข้อมูลมีสิทธิ์ในการจัดการเนื้อหาในพื้นที่ทํางานที่อุทิศให้กับการจัดการกระแสข้อมูลแบบรวมศูนย์ | |
มีพื้นที่ทํางานอื่นๆ อย่างน้อยหนึ่งรายการที่มีวัตถุประสงค์เพื่อมอบการเข้าถึงกระแสข้อมูลขั้นสุดท้าย ซึ่งให้ข้อมูลที่พร้อมสําหรับการผลิตไปยังแบบจําลองข้อมูล | |
กระแสข้อมูลสุดท้ายจะถูกสร้างขึ้นในพื้นที่ทํางานที่พร้อมใช้งานสําหรับผู้สร้างแบบจําลองข้อมูล ซึ่งเป็นแหล่งข้อมูลโดยใช้ตารางที่เชื่อมโยงไปยังกระแสข้อมูลการแปลง ตารางที่มีการคํานวณแสดงเอาต์พุตที่เตรียมไว้ซึ่งผู้ชมพื้นที่ทํางานสามารถมองเห็นได้สําหรับผู้สร้างแบบจําลองข้อมูล | |
ผู้สร้างแบบจําลองความหมาย (ที่ใช้เอาต์พุตกระแสข้อมูล) มีผู้ชมเข้าถึงพื้นที่ทํางานที่มีเอาต์พุตกระแสข้อมูลขั้นสุดท้าย ผู้สร้างกระแสข้อมูลยังสามารถเข้าถึงเพื่อจัดการและเผยแพร่เนื้อหาในพื้นที่ทํางาน (ไม่ได้แสดงไว้ในไดอะแกรมสถานการณ์) | |
ผู้สร้างแบบจําลองความหมายใช้ กระแส ข้อมูลขั้นสุดท้ายเป็น แหล่งข้อมูล เมื่อพัฒนาแบบจําลองข้อมูลใน Power BI Desktop เมื่อพร้อมแล้ว ผู้สร้างแบบจําลองความหมายจะเผยแพร่ไฟล์ Power BI Desktop (.pbix) ที่มีแบบจําลองข้อมูลไปยังบริการของ Power BI (ไม่ได้แสดงในไดอะแกรมสถานการณ์) | |
ผู้ดูแลระบบ Fabric จัดการการตั้งค่าในพอร์ทัลผู้ดูแลระบบ | |
ในพอร์ทัลผู้ดูแลระบบ ผู้ดูแลระบบ Power BI สามารถตั้งค่าการเชื่อมต่อ Azure เพื่อจัดเก็บข้อมูลกระแสข้อมูลในบัญชีของพวกเขา Azure Data Lake Storage รุ่น2 (ADLS Gen2) ได้ การตั้งค่ารวมถึงการกําหนดบัญชีที่เก็บข้อมูลระดับผู้เช่าและเปิดใช้งานสิทธิ์การจัดเก็บระดับพื้นที่ทํางาน | |
ตามค่าเริ่มต้น กระแสข้อมูลจะจัดเก็บข้อมูลโดยใช้ที่เก็บข้อมูลภายในที่จัดการโดยบริการของ Power BI หรือผลลัพธ์ข้อมูลโดยกระแสข้อมูลสามารถจัดเก็บไว้ในบัญชี ADLS Gen2 ขององค์กรได้ | |
ผู้ดูแลระบบผ้าจะดูแลและตรวจสอบกิจกรรมในพอร์ทัล Fabric |
ประเด็นสําคัญ
ต่อไปนี้คือประเด็นสําคัญบางประการที่เน้นเกี่ยวกับสถานการณ์การเตรียมข้อมูลขั้นสูง
กระแสข้อมูล
กระแสข้อมูลประกอบด้วยคอลเลกชันของตาราง (หรือที่เรียกว่าเอนทิตี) แต่ละตารางจะถูกกําหนดโดยคิวรี ซึ่งประกอบด้วยขั้นตอนการเตรียมข้อมูลที่จําเป็นในการโหลดตารางที่มีข้อมูล งานทั้งหมดในการสร้างกระแสข้อมูลเสร็จสิ้นแล้วใน Power Query Online คุณสามารถสร้างกระแสข้อมูลใน หลายผลิตภัณฑ์ รวมถึง Power Apps, Dynamics 365 Customer Insights และ Power BI
หมายเหตุ
คุณไม่สามารถสร้างกระแสข้อมูลในพื้นที่ทํางานส่วนบุคคลในบริการของ Power BI ได้
ชนิดของกระแสข้อมูล
การใช้ แบบเอกสาร สําเร็จรูปที่ส่วนประกอบได้เป็นหลักการออกแบบที่ช่วยให้คุณสามารถจัดการ ปรับใช้ และรักษาความปลอดภัยส่วนประกอบของระบบ จากนั้นใช้องค์ประกอบเหล่านี้ในชุดข้อมูลต่างๆ การสร้างกระแสข้อมูลแบบโมดูลาร์ที่มีในตัวเองซึ่งเฉพาะเจาะจงสําหรับวัตถุประสงค์นั้นเป็นแนวทางปฏิบัติที่ดีที่สุด ซึ่งช่วยให้เกิดการนําข้อมูลกลับมาใช้ใหม่และขนาดองค์กร กระแสข้อมูลแบบแยกส่วนยังง่ายต่อการจัดการและทดสอบ
กระแสข้อมูลสามชนิดจะแสดงในไดอะแกรมสถานการณ์: การจัดเตรียมกระแสข้อมูล กระแสข้อมูลการแปลง และกระแสข้อมูลขั้นสุดท้าย
การจัดเตรียมกระแสข้อมูล
กระแสข้อมูลการแบ่งระยะ (บางครั้งเรียกว่ากระแสข้อมูลการแยกข้อมูล) จะคัดลอกข้อมูลดิบตามที่อยู่จากแหล่งข้อมูล การมีข้อมูลดิบที่แยกออกมาด้วยการแปลงข้อมูลที่น้อยที่สุดหมายความว่ากระแสข้อมูลการแปลงข้อมูลปลายทาง (อธิบายต่อไป) สามารถใช้กระแสข้อมูลการจัดเตรียมเป็นแหล่งข้อมูลของพวกเขาได้ โมดูลนี้จะมีประโยชน์เมื่อ:
- การเข้าถึงแหล่งข้อมูลจะถูกจํากัดให้จํากัดให้แคบลงสําหรับหน้าต่างและ/หรือผู้ใช้บางราย
- ความสอดคล้องกันทางโลกเป็นที่ต้องการเพื่อให้แน่ใจว่ากระแสข้อมูลปลายทางทั้งหมด (และแบบจําลองความหมายที่เกี่ยวข้อง) ส่งมอบข้อมูลที่ดึงมาจากแหล่งข้อมูลในเวลาเดียวกัน
- การลดจํานวนคิวรีที่ส่งไปยังแหล่งข้อมูลเป็นสิ่งจําเป็นเนื่องจากข้อจํากัดของระบบต้นทางหรือความสามารถในการสนับสนุนคิวรีการวิเคราะห์
- สําเนาของข้อมูลต้นทางมีประโยชน์สําหรับกระบวนการการกระทบยอดและการตรวจสอบคุณภาพของข้อมูล
การแปลงกระแสข้อมูล
กระแสข้อมูลการแปลง (บางครั้งเรียกว่ากระแสข้อมูลที่ล้างข้อมูลแล้ว) จะแหล่งข้อมูลจากตารางที่เชื่อมโยงที่เชื่อมต่อกับกระแสข้อมูลการจัดเตรียม การแยกการแปลงข้อมูลจากกระบวนการแยกข้อมูลเป็น แนวทางปฏิบัติ ที่ดีที่สุด
กระแสข้อมูลการแปลงข้อมูลมีขั้นตอนการแปลงข้อมูลทั้งหมดที่จําเป็นในการเตรียมและปรับโครงสร้างข้อมูลใหม่ อย่างไรก็ตาม ยังคงมุ่งเน้นไปที่การนํากลับมาใช้ใหม่ที่เลเยอร์นี้เพื่อให้แน่ใจว่ากระแสข้อมูลเหมาะสําหรับกรณีและวัตถุประสงค์การใช้งานหลายรายการ
กระแสข้อมูลสุดท้าย
กระแสข้อมูลสุดท้ายแสดงผลลัพธ์ที่เตรียมไว้ การแปลงเพิ่มเติมบางอย่างอาจเกิดขึ้นตามกรณีการใช้งานและวัตถุประสงค์ สําหรับการวิเคราะห์ ตาราง Schema รูปดาว (มิติหรือข้อเท็จจริง) คือการออกแบบที่ต้องการของกระแสข้อมูลขั้นสุดท้าย
ตารางที่มีการคํานวณสามารถมองเห็นได้สําหรับผู้สร้างแบบจําลองข้อมูลที่ได้รับบทบาทผู้ชมพื้นที่ทํางาน ชนิดตารางนี้จะอธิบายไว้ใน ชนิดของหัวข้อตาราง กระแสข้อมูลด้านล่าง
หมายเหตุ
ทะเลสาบข้อมูลมักจะมี โซนต่าง ๆ เช่น ทองแดง เงิน และทอง กระแสข้อมูลสามชนิดแสดงรูปแบบการออกแบบที่คล้ายกัน เพื่อให้เกิดการตัดสินใจเกี่ยวกับสถาปัตยกรรมข้อมูลที่ดีที่สุดเท่าที่จะเป็นไปได้ ให้นึกถึงว่าใครจะรักษาข้อมูล การใช้งานที่คาดหวังของข้อมูล และระดับทักษะที่กําหนดโดยบุคคลที่เข้าถึงข้อมูล
พื้นที่ทํางานสําหรับกระแสข้อมูล
หากคุณต้องการสร้างกระแสข้อมูลทั้งหมดในพื้นที่ทํางานเดียว กระแสข้อมูลจะจํากัดขอบเขตของความสามารถในการนํามาใช้ใหม่อย่างมีนัยสําคัญ การใช้พื้นที่ทํางานเดียวยังจํากัดตัวเลือกความปลอดภัยที่พร้อมใช้งานเมื่อสนับสนุนผู้ใช้หลายประเภทในทีมและ/หรือสําหรับกรณีการใช้งานที่แตกต่างกัน เราขอแนะนําให้ใช้พื้นที่ทํางานหลายรายการ ซึ่งจะให้ความยืดหยุ่นที่ดีกว่าเมื่อคุณต้องการสนับสนุนผู้สร้างแบบบริการตนเองจากพื้นที่ต่างๆ ขององค์กร
พื้นที่ทํางานสองชนิดที่แสดงในไดอะแกรมสถานการณ์จําลองได้แก่:
พื้นที่ทํางาน 1 : จะจัดเก็บ กระแสข้อมูลที่จัดการจากส่วนกลาง(บางครั้งเรียกว่าพื้นที่ทํางานหลังบ้าน ) ซึ่งประกอบด้วยทั้งการจัดเตรียมและการแปลงกระแสข้อมูลเนื่องจากมีการจัดการโดยบุคคลเดียวกัน ผู้สร้างกระแสข้อมูลมักจะมาจากทีมส่วนกลาง เช่น IT, BI หรือศูนย์แห่งความเป็นเลิศ ควรได้รับมอบหมายให้กับบทบาทผู้ดูแลระบบพื้นที่ทํางาน สมาชิก หรือผู้สนับสนุน - พื้นที่ทํางาน 2: จะจัดเก็บและส่งมอบ เอาต์พุตกระแสข้อมูลสุดท้าย ให้กับผู้บริโภคข้อมูล (บางครั้งเรียกว่าพื้นที่ทํางานของผู้ใช้ ) ผู้สร้างแบบจําลองความหมายมักเป็นนักวิเคราะห์แบบบริการตนเอง ผู้ใช้ระดับสูง หรือวิศวกรข้อมูลพลเมือง ควรได้รับมอบหมายบทบาทผู้ชมพื้นที่ทํางานเนื่องจากจําเป็นต้องใช้ผลลัพธ์ของกระแสข้อมูลขั้นสุดท้ายเท่านั้น เพื่อสนับสนุนผู้สร้างแบบจําลองเชิงความหมายจากพื้นที่ต่าง ๆ ขององค์กร คุณสามารถสร้างพื้นที่ทํางานจํานวนมากเช่นนี้ขึ้นอยู่กับความต้องการของกรณีการใช้งานและความปลอดภัย
เคล็ดลับ
เราขอแนะนําให้ตรวจทานวิธีการเพื่อ สนับสนุนผู้สร้าง แบบจําลองความหมายตามที่อธิบายไว้ใน สถานการณ์การใช้งานการเตรียม ข้อมูลแบบบริการตนเอง สิ่งสําคัญคือต้องทําความเข้าใจว่าผู้สร้างแบบจําลองความหมายยังคงสามารถใช้ความสามารถเต็มของ Power Query ภายใน Power BI Desktop ได้ พวกเขาสามารถเลือกที่จะเพิ่มขั้นตอนคิวรีเพื่อแปลงข้อมูลกระแสข้อมูลหรือผสานเอาต์พุตกระแสข้อมูลกับแหล่งข้อมูลอื่นได้
ชนิดของตารางกระแสข้อมูล
ตารางกระแสข้อมูลสามชนิด (หรือที่เรียกว่า เอนทิตี) จะแสดงในไดอะแกรมสถานการณ์
- ตาราง มาตรฐาน : คิวรีแหล่งข้อมูลภายนอก เช่น ฐานข้อมูล ในไดอะแกรมสถานการณ์ ตารางมาตรฐานจะแสดงอยู่ในกระแสข้อมูลการจัดเตรียม
-
ตารางที่เชื่อมโยง: อ้างอิงตารางจากกระแสข้อมูลอื่น ตารางที่มีการเชื่อมโยงไม่ซ้ํากับข้อมูล แต่จะช่วยให้สามารถนําตารางมาตรฐานกลับมาใช้ซ้ําได้หลายครั้งเพื่อวัตถุประสงค์หลายอย่าง ตารางที่เชื่อมโยงจะไม่สามารถมองเห็นได้สําหรับผู้ชมพื้นที่ทํางานเนื่องจากพวกเขาสืบทอดสิทธิ์จากกระแสข้อมูลต้นฉบับ ในไดอะแกรมสถานการณ์ มีการแสดงตารางที่เชื่อมโยงสองครั้ง:
- ในกระแสข้อมูลการแปลงสําหรับการเข้าถึงข้อมูลในกระแสข้อมูลการจัดเตรียม
- ในกระแสข้อมูลสุดท้ายสําหรับการเข้าถึงข้อมูลในกระแสข้อมูลการแปลง
-
ตารางที่คํานวณ : ทําการคํานวณเพิ่มเติมโดยใช้กระแสข้อมูลที่แตกต่างกันเป็นแหล่งข้อมูล ตารางที่มีการคํานวณอนุญาตให้กําหนดเอาต์พุตตามความจําเป็นสําหรับกรณีการใช้งานแต่ละรายการ ในแผนภาพสถานการณ์ ตารางที่มีการคํานวณมีรูปภาพเป็นสองเท่า:
- ในกระแสข้อมูลการแปลงสําหรับการดําเนินการ แปลงข้อมูลทั่วไป
- ในกระแสข้อมูลสุดท้ายสําหรับการส่งเอาต์พุตไปยังผู้สร้างแบบจําลองความหมาย เนื่องจากตารางที่มีการคํานวณยืนยันข้อมูลอีกครั้ง (หลังจากรีเฟรชกระแสข้อมูล) ผู้สร้างแบบจําลองข้อมูลสามารถเข้าถึงตารางที่มีการคํานวณในกระแสข้อมูลขั้นสุดท้ายได้ ในกรณีนี้ ผู้สร้างแบบจําลองข้อมูลควรได้รับสิทธิ์เข้าถึงด้วยบทบาทผู้ชมพื้นที่ทํางาน
หมายเหตุ
มีเทคนิคการออกแบบ รูปแบบ และ แนวทางปฏิบัติ ที่ดีที่สุดมากมายที่สามารถนํากระแสข้อมูลจากบริการตนเองไปพร้อมสําหรับองค์กร นอกจากนี้ กระแสข้อมูลในพื้นที่ทํางานที่มีโหมดสิทธิ์การใช้งานที่ตั้งค่าเป็น Premium ต่อผู้ใช้ หรือความจุพรีเมียมจะได้รับประโยชน์จากคุณลักษณะขั้นสูง ตารางที่เชื่อมโยงและตารางที่มีการคํานวณ (หรือที่เรียกว่า เอนทิตี) เป็นคุณลักษณะขั้นสูงสองอย่างที่จําเป็นสําหรับการเพิ่มการนํากระแสข้อมูลกลับมาใช้ใหม่
กลไกการคํานวณขั้นสูง
กลไกการคํานวณขั้นสูงเป็นคุณลักษณะขั้นสูงที่พร้อมใช้งานกับ Power BI Premium
สำคัญ
ในบางครั้งที่บทความนี้อ้างอิงถึง Power BI Premium หรือการสมัครใช้งานความจุ (P SKU) โปรดทราบว่าในขณะนี้ Microsoft กําลังรวมตัวเลือกการซื้อและหยุดใช้งาน Power BI Premium ต่อความจุ SKU ลูกค้าใหม่และลูกค้าที่มีอยู่ควรพิจารณาซื้อการสมัครใช้งานความจุ Fabric (F SKU) แทน
สําหรับข้อมูลเพิ่มเติม โปรดดู ที่ การอัปเดตที่สําคัญเกี่ยวกับการให้สิทธิ์การใช้งาน Power BI Premium และ คําถามที่ถามบ่อยของ Power BI Premium
กลไกการคํานวณขั้นสูงช่วยปรับปรุงประสิทธิภาพของตารางที่เชื่อมโยง (ภายในพื้นที่ทํางานเดียวกัน) ที่อ้างอิง (ลิงก์ไปยัง) กระแสข้อมูล เพื่อรับประโยชน์สูงสุดจากกลไกการคํานวณขั้นสูง:
- แยกการจัดเตรียมและการแปลงกระแสข้อมูลออก
- ใช้พื้นที่ทํางานเดียวกันเพื่อจัดเก็บกระแสข้อมูลการจัดเตรียมและการแปลง
- ใช้การดําเนินการที่ซับซ้อนซึ่งสามารถ ทําการพับ คิวรีได้ตั้งแต่ต้นในขั้นตอนคิวรี การจัดลําดับความสําคัญของการดําเนินการแบบพับได้สามารถช่วยให้บรรลุประสิทธิภาพการรีเฟรชที่ดีที่สุด
- ใช้ การรีเฟรช แบบเพิ่มหน่วยเพื่อลดระยะเวลาการรีเฟรชและการใช้ทรัพยากร
- ทําการทดสอบก่อนและบ่อยครั้งในระหว่างขั้นตอนการพัฒนา
การรีเฟรชกระแสข้อมูลและแบบจําลองความหมาย
กระแสข้อมูลเป็นแหล่งข้อมูลสําหรับแบบจําลองเชิงความหมาย ในกรณีส่วนใหญ่ มีการกําหนดตารางเวลาการรีเฟรชข้อมูลหลายรายการ: หนึ่งรายการสําหรับแต่ละกระแสข้อมูลและอีกหนึ่งรายการสําหรับแต่ละแบบจําลองความหมาย อีกวิธีหนึ่งคือ คุณสามารถใช้ DirectQuery จากแบบจําลองความหมายไปยังกระแสข้อมูล ซึ่งจําเป็นต้องใช้ Power BI Premium และกลไกการคํานวณขั้นสูง (ไม่ได้อธิบายไว้ในแผนภาพสถานการณ์)
Azure Data Lake Storage รุ่น2
บัญชี ADLS Gen2 เป็นบัญชีที่เก็บข้อมูล Azure ประเภทเฉพาะที่ เปิดใช้งานเนมสเปซ แบบลําดับชั้น ADLS Gen2 มีประสิทธิภาพ การจัดการ และการรักษาความปลอดภัยที่ดีกว่า สําหรับการใช้งานปริมาณงานวิเคราะห์ ตามค่าเริ่มต้น กระแสข้อมูล Power BI จะใช้ที่เก็บข้อมูลภายใน ซึ่งเป็นบัญชี data lake ที่มีอยู่แล้วภายในที่จัดการโดยบริการของ Power BI อีกทางหนึ่งคือ องค์กรสามารถ นําที่จัดเก็บข้อมูลดิบ ของตนเองมาเองได้ โดยการเชื่อมต่อกับบัญชี ADLS Gen2 ในองค์กรของพวกเขา
นี่คือข้อดีบางประการของการใช้ที่จัดเก็บข้อมูลทะเลสาบของคุณเอง:
- ผู้ใช้ (หรือกระบวนการ) สามารถเข้าถึงกระแสข้อมูลที่ถูกเก็บไว้ใน data lake ได้โดยตรง ซึ่งจะเป็นประโยชน์เมื่อมีการนํากระแสข้อมูลกลับมาใช้ใหม่นอกเหนือ Power BI ตัวอย่างเช่น Azure Data Factory สามารถเข้าถึงข้อมูลกระแสข้อมูลได้
- เครื่องมือหรือระบบอื่น ๆ สามารถจัดการข้อมูลใน data lake ได้ ในกรณีนี้ Power BI สามารถใช้ข้อมูลได้แทนที่จะจัดการ (ไม่ได้แสดงในไดอะแกรมสถานการณ์)
เมื่อใช้ตารางที่เชื่อมโยงหรือตารางที่มีการคํานวณ ตรวจสอบให้แน่ใจว่าแต่ละพื้นที่ทํางานถูกกําหนดให้กับบัญชีที่เก็บข้อมูล ADLS Gen2 เดียวกัน
หมายเหตุ
ข้อมูลของกระแสข้อมูลใน ADLS Gen2 จะถูกจัดเก็บไว้ภายในคอนเทนเนอร์เฉพาะของ Power BI คอนเทนเนอร์นี้แสดงอยู่ใน ไดอะแกรมสถานการณ์การใช้งานการเตรียม ข้อมูลแบบบริการตนเอง
การตั้งค่าพอร์ทัลผู้ดูแลระบบ
มีสองการตั้งค่าที่สําคัญในการจัดการในพอร์ทัลผู้ดูแลระบบ:
- การเชื่อมต่อ Azure : ส่วนการเชื่อมต่อ Azure ของพอร์ทัลผู้ดูแลระบบมีการตั้งค่าเพื่อตั้งค่าการเชื่อมต่อกับบัญชี ADLS Gen2 การตั้งค่านี้ช่วยให้ผู้ดูแลระบบ Power BI สามารถ นําที่จัดเก็บข้อมูลทะเลสาบ ของคุณเองไปยังกระแสข้อมูลได้ เมื่อกําหนดค่าแล้ว พื้นที่ทํางานสามารถใช้บัญชี data lake นั้นสําหรับการจัดเก็บได้
- ที่เก็บข้อมูลระดับพื้นที่ทํางาน: ผู้ดูแลระบบ Power BI สามารถตั้งค่าสิทธิ์การจัดเก็บระดับพื้นที่ทํางานได้ เมื่อเปิดใช้งาน การตั้งค่าจะอนุญาตให้ ผู้ดูแลระบบพื้นที่ทํางานใช้บัญชี ที่เก็บข้อมูลอื่นสําหรับบัญชีที่ตั้งค่าไว้ในระดับผู้เช่า การเปิดใช้งานการตั้งค่านี้จะเป็นประโยชน์สําหรับหน่วยธุรกิจแบบกระจายที่จัดการที่จัดเก็บข้อมูลทะเลสาบข้อมูลของตนเองใน Azure
การตั้งค่าเกตเวย์
โดยทั่วไปแล้ว เกตเวย์ข้อมูลภายในองค์กรจําเป็นสําหรับการเชื่อมต่อกับแหล่งข้อมูลที่อยู่ภายในเครือข่ายส่วนตัวหรือเครือข่ายเสมือน
จําเป็นต้องใช้เกตเวย์ข้อมูลเมื่อ:
- การเขียนกระแสข้อมูลใน Power Query Online ที่เชื่อมต่อกับข้อมูลองค์กรส่วนตัว
- การรีเฟรชกระแสข้อมูลที่เชื่อมต่อกับข้อมูลองค์กรส่วนตัว
เคล็ดลับ
กระแสข้อมูลจําเป็นต้องใช้เกตเวย์ข้อมูลส่วนกลางในโหมดมาตรฐาน เกตเวย์ในโหมดส่วนบุคคลไม่ได้รับการสนับสนุนเมื่อทํางานกับกระแสข้อมูล
ระบบ oversight
บันทึกกิจกรรมบันทึกกิจกรรมของผู้ใช้ที่เกิดขึ้นในบริการของ Power BI ผู้ดูแลระบบ Power BI สามารถใช้ข้อมูลบันทึกกิจกรรมที่รวบรวมไว้เพื่อทํา การตรวจสอบ เพื่อช่วยให้พวกเขาเข้าใจรูปแบบการใช้งานและการเริ่มนําไปใช้ได้ บันทึกกิจกรรมยังมีประโยชน์สําหรับการสนับสนุนความพยายามด้านการกํากับดูแล การตรวจสอบความปลอดภัย และข้อกําหนดการปฏิบัติตามกฎระเบียบ ในสถานการณ์การเตรียมข้อมูลขั้นสูง ข้อมูลบันทึกกิจกรรมมีประโยชน์ในการติดตามการจัดการและการใช้กระแสข้อมูล
เนื้อหาที่เกี่ยวข้อง
สําหรับสถานการณ์อื่น ๆ ที่มีประโยชน์เพื่อช่วยคุณในการตัดสินใจการใช้งาน Power BI โปรดดู บทความ สถานการณ์ การใช้งาน Power BI