บทนำ
พิจารณาสถานการณ์ที่คุณนำเข้าข้อมูลลงใน Power BI จากแหล่งที่มาที่แตกต่างกันหลายแห่ง และไม่มีการเตรียมข้อมูลดังกล่าวให้พร้อมสำหรับการวิเคราะห์ เมื่อคุณตรวจสอบข้อมูล สิ่งใดทำให้ข้อมูลไม่พร้อมสำหรับการวิเคราะห์
เมื่อตรวจสอบข้อมูล คุณพบปัญหาหลายประการ รวมถึง:
คอลัมน์ที่มีชื่อว่าEmployment status มีเพียงตัวเลขเท่านั้น
หลายคอลัมน์มีข้อผิดพลาด
บางคอลัมน์มีค่าว่าง
ID ลูกค้าในบางคอลัมน์ปรากฏขึ้นในลักษณะที่ซ้ำกันหลาย ๆ ครั้ง
ในคอลัมน์ที่อยู่เดียวนั้นรวมถึงถนน เมือง รัฐ และรหัสไปรษณีย์ด้วย
คุณเริ่มต้นทำงานกับข้อมูล แต่ทุกครั้งที่คุณสร้างวิชวลในรายงาน คุณได้รับข้อมูลที่ไม่ถูกต้อง ผลลัพธ์ที่ไม่เหมาะสม และรายงานแบบง่ายเกี่ยวกับผลรวมยอดขายทีี่ไม่ถูกต้อง
ข้อมูลสกปรกนั้นอาจมีมากมายจนล้นเหลือ และถึงแม้ว่าคุณจะรู้สึกท้อแท้ แต่คุณก็ตัดสินใจที่จะทํางานต่อไปและค้นหาวิธีทําให้แบบจําลองความหมายนี้บริสุทธิ์ที่สุดเท่าที่จะเป็นไปได้
โชคดีที่ Power BI และ Power Query นำเสนอสภาพแวดล้อมที่มีประสิทธิภาพในการทำความสะอาดและเตรียมข้อมูล ข้อมูลสะอาดมีข้อดีดังต่อไปนี้:
หน่วยวัดและคอลัมน์สร้างผลลัพธ์ที่แม่นยำมากขึ้น เมื่อมีการรวมและคำนวณข้อมูล
ตารางถูกจัดให้เป็นระเบียบ ซึ่งผู้ใช้สามารถค้นหาข้อมูลได้อย่างง่ายดาย
รายการที่ซ้ำกันถูกลบออก ทำให้การนำทางไปยังข้อมูลนั้นง่ายขึ้น นอกจากนี้ยังสร้างคอลัมน์ที่สามารถใช้ในตัวแบ่งส่วนข้อมูลและตัวกรองได้
คอลัมน์ที่มีความซับซ้อนสามารถแยกออกเป็นสองคอลัมน์ได้ง่ายขึ้น สามารถรวมหลายคอลัมน์เป็นคอลัมน์เดียวสำหรับการอ่านได้
สามารถแทนที่รหัสและจำนวนเต็มด้วยค่าที่สามารถอ่านได้
ในหลักสูตรการเรียนรู้นี้ คุณจะได้เรียนรู้วิธีการ:
แก้ไขความไม่สอดคล้อง ค่าที่ไม่ได้คาดไว้ หรือค่าว่าง และคุณภาพของข้อมูล
ใช้การเปลี่ยนค่าที่ใช้งานง่าย
ข้อมูลโปรไฟล์ที่ช่วยให้คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับคอลัมน์ที่เฉพาะเจาะจงก่อนที่จะใช้คอลัมน์ดังกล่าว
ประเมินและแปลงชนิดข้อมูลคอลัมน์
ใช้การจัดรูปร่างข้อมูลกับโครงสร้างตารางต่าง ๆ
รวมคิวรี
ใช้มาตรฐานการตั้งชื่อที่ใช้งานง่ายกับคอลัมน์และคิวรีต่าง ๆ
แก้ไขรหัส M ในเครื่องมือแก้ไขขั้นสูง