บทนำ

เสร็จสมบูรณ์เมื่อ

พิจารณาสถานการณ์ที่คุณนำเข้าข้อมูลลงใน Power BI จากแหล่งที่มาที่แตกต่างกันหลายแห่ง และไม่มีการเตรียมข้อมูลดังกล่าวให้พร้อมสำหรับการวิเคราะห์ เมื่อคุณตรวจสอบข้อมูล สิ่งใดทำให้ข้อมูลไม่พร้อมสำหรับการวิเคราะห์

เมื่อตรวจสอบข้อมูล คุณพบปัญหาหลายประการ รวมถึง:

  • คอลัมน์ที่มีชื่อว่าEmployment status มีเพียงตัวเลขเท่านั้น

  • หลายคอลัมน์มีข้อผิดพลาด

  • บางคอลัมน์มีค่าว่าง

  • ID ลูกค้าในบางคอลัมน์ปรากฏขึ้นในลักษณะที่ซ้ำกันหลาย ๆ ครั้ง

  • ในคอลัมน์ที่อยู่เดียวนั้นรวมถึงถนน เมือง รัฐ และรหัสไปรษณีย์ด้วย

คุณเริ่มต้นทำงานกับข้อมูล แต่ทุกครั้งที่คุณสร้างวิชวลในรายงาน คุณได้รับข้อมูลที่ไม่ถูกต้อง ผลลัพธ์ที่ไม่เหมาะสม และรายงานแบบง่ายเกี่ยวกับผลรวมยอดขายทีี่ไม่ถูกต้อง

ข้อมูลสกปรกนั้นอาจมีมากมายจนล้นเหลือ และถึงแม้ว่าคุณจะรู้สึกท้อแท้ แต่คุณก็ตัดสินใจที่จะทํางานต่อไปและค้นหาวิธีทําให้แบบจําลองความหมายนี้บริสุทธิ์ที่สุดเท่าที่จะเป็นไปได้

โชคดีที่ Power BI และ Power Query นำเสนอสภาพแวดล้อมที่มีประสิทธิภาพในการทำความสะอาดและเตรียมข้อมูล ข้อมูลสะอาดมีข้อดีดังต่อไปนี้:

  • หน่วยวัดและคอลัมน์สร้างผลลัพธ์ที่แม่นยำมากขึ้น เมื่อมีการรวมและคำนวณข้อมูล

  • ตารางถูกจัดให้เป็นระเบียบ ซึ่งผู้ใช้สามารถค้นหาข้อมูลได้อย่างง่ายดาย

  • รายการที่ซ้ำกันถูกลบออก ทำให้การนำทางไปยังข้อมูลนั้นง่ายขึ้น นอกจากนี้ยังสร้างคอลัมน์ที่สามารถใช้ในตัวแบ่งส่วนข้อมูลและตัวกรองได้

  • คอลัมน์ที่มีความซับซ้อนสามารถแยกออกเป็นสองคอลัมน์ได้ง่ายขึ้น สามารถรวมหลายคอลัมน์เป็นคอลัมน์เดียวสำหรับการอ่านได้

  • สามารถแทนที่รหัสและจำนวนเต็มด้วยค่าที่สามารถอ่านได้

ในหลักสูตรการเรียนรู้นี้ คุณจะได้เรียนรู้วิธีการ:

  • แก้ไขความไม่สอดคล้อง ค่าที่ไม่ได้คาดไว้ หรือค่าว่าง และคุณภาพของข้อมูล

  • ใช้การเปลี่ยนค่าที่ใช้งานง่าย

  • ข้อมูลโปรไฟล์ที่ช่วยให้คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับคอลัมน์ที่เฉพาะเจาะจงก่อนที่จะใช้คอลัมน์ดังกล่าว

  • ประเมินและแปลงชนิดข้อมูลคอลัมน์

  • ใช้การจัดรูปร่างข้อมูลกับโครงสร้างตารางต่าง ๆ

  • รวมคิวรี

  • ใช้มาตรฐานการตั้งชื่อที่ใช้งานง่ายกับคอลัมน์และคิวรีต่าง ๆ

  • แก้ไขรหัส M ในเครื่องมือแก้ไขขั้นสูง