ภาพรวมของ Copilot สําหรับวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูล (ตัวอย่าง)
สําคัญ
คุณลักษณะนี้อยู่ในแสดงตัวอย่าง
Copilot สําหรับวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูลเป็นผู้ช่วย AI ที่ช่วยวิเคราะห์และแสดงผลข้อมูลด้วยภาพ ทํางานได้กับตารางและไฟล์ของ Lakehouse ชุดข้อมูล Power BI และเฟรมข้อมูล pandas/spark/fabric ที่ให้คําตอบและส่วนย่อยของโค้ดโดยตรงในสมุดบันทึก วิธีที่มีประสิทธิภาพที่สุดในการใช้ Copilot คือการเพิ่มข้อมูลของคุณเป็นกรอบข้อมูล คุณสามารถถามคําถามของคุณในแผงแชทและ AI ให้คําตอบหรือรหัสเพื่อคัดลอกลงในสมุดบันทึกของคุณ ซึ่งเข้าใจสคีมาและเมตาดาต้าของข้อมูลของคุณ และถ้าข้อมูลถูกโหลดลงใน dataframe จะมีการรับรู้ข้อมูลภายในเฟรมข้อมูลเช่นกัน คุณสามารถขอให้ Copilot ให้ข้อมูลเชิงลึกเกี่ยวกับข้อมูล สร้างโค้ดสําหรับการแสดงภาพ หรือใส่รหัสสําหรับการแปลงข้อมูล และจดจําชื่อไฟล์เพื่อให้ง่ายต่อการอ้างอิง Copilot ทําให้การวิเคราะห์ข้อมูลมีประสิทธิภาพขึ้นโดยการกําจัดการเข้ารหัสที่ซับซ้อน
โน้ต
- ผู้ดูแลระบบของคุณต้องเปิดใช้งานการสลับผู้เช่าก่อนที่คุณจะเริ่มใช้ Copilot ดูบทความ Copilot การตั้งค่าผู้เช่า สําหรับรายละเอียด
- ความจุ F64 หรือ P1 ของคุณจะต้องอยู่ในหนึ่งในภูมิภาคที่ระบุไว้ในบทความนี้ ความพร้อมใช้งานของภูมิภาค Fabric
- ถ้าผู้เช่าหรือความจุของคุณอยู่นอกสหรัฐอเมริกาหรือฝรั่งเศส Copilot ถูกปิดใช้งานตามค่าเริ่มต้น เว้นแต่ว่าผู้ดูแลระบบผู้เช่า Fabric ของคุณจะเปิดใช้งานข้อมูล ที่ส่งไปยัง Azure OpenAI สามารถดําเนินการภายนอกภูมิภาคทางภูมิศาสตร์ของผู้เช่า ขอบเขตการปฏิบัติตามกฎระเบียบ หรืออินสแตนซ์ระบบคลาวด์แห่งชาติ การตั้งค่าผู้เช่าในพอร์ทัลผู้ดูแลระบบผ้า
- Copilot ใน Microsoft Fabric ไม่ได้รับการสนับสนุนในการทดลองใช้ SKU รองรับเฉพาะ SKU ที่ชําระเงิน (F64 หรือสูงกว่า หรือ P1 หรือสูงกว่า) เท่านั้น
- ขณะนี้ Copilot ใน Fabric จะเผยแพร่ในการแสดงตัวอย่างสาธารณะ และคาดว่าจะพร้อมใช้งานสําหรับลูกค้าทั้งหมดภายในสิ้นเดือนมีนาคม 2024
- ดูบทความ ภาพรวมของ Copilot ใน Fabric และ Power BI สําหรับข้อมูลเพิ่มเติม
ความรู้เบื้องต้นเกี่ยวกับ Copilot ด้านวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูลสําหรับวิทยาศาสตร์ข้อมูลผ้า
ด้วย Copilot สําหรับวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูลคุณสามารถแชทกับผู้ช่วย AI ที่สามารถช่วยคุณในการจัดการการวิเคราะห์ข้อมูลและงานด้านการแสดงภาพของคุณ คุณสามารถถามคําถาม Copilot เกี่ยวกับตารางเลคเฮ้าส์, ชุดข้อมูล Power BI หรือเฟรมข้อมูล Pandas/Spark ภายในสมุดบันทึกได้ Copilot คําตอบเป็นภาษาธรรมชาติหรือส่วนย่อยของโค้ด Copilot ยังสามารถสร้างรหัสเฉพาะข้อมูลสําหรับคุณได้โดย ขึ้นอยู่กับงาน ตัวอย่างเช่น Copilot สําหรับ วิทยาศาสตร์ข้อมูล และ วิศวกรรมข้อมูล สามารถสร้างโค้ดสําหรับ:
- การสร้างแผนภูมิ
- การกรองข้อมูล
- การใช้การแปลง
- แบบจําลองการเรียนรู้ของเครื่อง
ก่อนอื่น ให้เลือกไอคอน Copilot ในริบบอนสมุดบันทึก แผงการสนทนา Copilot เปิดขึ้น และเซลล์ใหม่จะปรากฏขึ้นที่ด้านบนของสมุดบันทึกของคุณ เซลล์นี้ต้องทํางานทุกครั้งที่เซสชัน Spark โหลดในสมุดบันทึก Fabric มิฉะนั้น ประสบการณ์การใช้งาน Copilot จะไม่ทํางานอย่างถูกต้อง เรากําลังอยู่ระหว่างการประเมินกลไกอื่น ๆ ในการจัดการการเตรียมใช้งานที่จําเป็นนี้ในการเผยแพร่ในอนาคต
เรียกใช้เซลล์ที่ด้านบนของสมุดบันทึกด้วยโค้ดนี้:
#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics
หลังจากดําเนินการเซลล์สําเร็จแล้ว คุณสามารถใช้ Copilotได้ คุณต้องรีรันเซลล์ที่ด้านบนของสมุดบันทึกทุกครั้งที่เซสชันของคุณในสมุดบันทึกปิดลง
เมื่อต้องการเพิ่มประสิทธิภาพ Copilot ให้ใหญ่ที่สุด ให้โหลดตารางหรือชุดข้อมูลเป็นกรอบข้อมูลในสมุดบันทึกของคุณ ด้วยวิธีนี้ AI สามารถเข้าถึงข้อมูลและทําความเข้าใจโครงสร้างและเนื้อหาได้ จากนั้นเริ่มแชทกับ AI เลือกไอคอนการสนทนาในแถบเครื่องมือสมุดบันทึก และพิมพ์คําถามของคุณหรือการร้องขอในแผงการสนทนา ตัวอย่างเช่น คุณสามารถถาม:
- "อายุเฉลี่ยของลูกค้าในชุดข้อมูลนี้คืออะไร"
- "แสดงแผนภูมิแท่งยอดขายตามภูมิภาค"
และอื่น ๆ อีกมาก Copilot ตอบกลับด้วยคําตอบหรือรหัส ซึ่งคุณสามารถคัดลอกและวางสมุดบันทึกของคุณได้ Copilot สําหรับวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูลเป็นวิธีที่สะดวกในการโต้ตอบในการสํารวจและวิเคราะห์ข้อมูลของคุณ
เมื่อคุณใช้ Copilotคุณยังสามารถเรียกใช้คําสั่งเวทมนตร์ภายในเซลล์สมุดบันทึกเพื่อรับผลลัพธ์ได้โดยตรงในสมุดบันทึก ตัวอย่างเช่น สําหรับคําตอบของภาษาธรรมชาติในการตอบกลับ คุณสามารถถามคําถามโดยใช้คําสั่ง "%%chat" เช่น:
%%chat
What are some machine learning models that may fit this dataset?
หรือ
%%code
Can you generate code for a logistic regression that fits this data?
Copilot สําหรับวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูลยังมี schema และการรับรู้เมตาดาต้าของตารางในเลคเฮ้าส์ Copilot สามารถให้ข้อมูลที่เกี่ยวข้องในบริบทของข้อมูลของคุณในเลคเฮ้าส์ที่แนบมา ตัวอย่างเช่น คุณสามารถถาม:
- "มีตารางกี่ตารางในเลคเฮาส์"
- "คอลัมน์ของลูกค้าตารางคืออะไร"
Copilot ตอบกลับด้วยข้อมูลที่เกี่ยวข้องถ้าคุณเพิ่มเลคเฮาส์ลงในสมุดบันทึก Copilot ยังทราบชื่อของไฟล์ที่เพิ่มไปยังเลคเฮ้าส์ใด ๆ ที่แนบมากับสมุดบันทึก คุณสามารถอ้างอิงไปยังไฟล์เหล่านั้นตามชื่อในแชทของคุณ ตัวอย่างเช่น ถ้าคุณมีไฟล์ที่มีชื่อ sales.csv ในเลคเฮ้าส์ของคุณ คุณสามารถถามว่า "สร้างกรอบข้อมูลจาก sales.csv" Copilot สร้างรหัสและแสดงในแผงการสนทนา ด้วย Copilot สําหรับสมุดบันทึก คุณสามารถเข้าถึงและคิวรีข้อมูลของคุณจากแหล่งต่าง ๆ ได้อย่างง่ายดาย คุณไม่จําเป็นต้องใช้ไวยากรณ์คําสั่งที่แน่นอนเพื่อทํา
เคล็ด ลับ
- "ล้าง" การสนทนาของคุณในแผง Copilot แชทด้วยไม้กวาดที่อยู่ด้านบนของแผงแชท Copilot คงความรู้เกี่ยวกับอินพุตหรือเอาต์พุตใดๆ ในระหว่างเซสชัน แต่วิธีนี้จะช่วยได้ถ้าคุณพบว่าเนื้อหาปัจจุบันรบกวน
- ใช้ไลบรารีแชทมายากลเพื่อกําหนดค่าการตั้งค่าเกี่ยวกับ Copilotรวมถึงการตั้งค่าความเป็นส่วนตัว โหมดการแชร์เริ่มต้นถูกออกแบบมาเพื่อขยายการแชร์บริบท Copilot มีสิทธิ์เข้าถึง ดังนั้นการจํากัดข้อมูลที่ให้ copilot สามารถส่งผลกระทบโดยตรงและส่งผลต่อความเกี่ยวข้องของการตอบกลับได้อย่างมาก
- เมื่อ Copilot เปิดใช้ครั้งแรก จะมีชุดพร้อมท์ที่เป็นประโยชน์ที่สามารถช่วยให้คุณเริ่มต้นใช้งานได้ พวกเขาสามารถช่วยเริ่มต้นการสนทนาของคุณด้วย Copilotได้ ในการอ้างอิงถึงพร้อมท์ในภายหลัง คุณสามารถใช้ปุ่มประกายไฟที่ด้านล่างของแผงการสนทนา
- คุณสามารถ "ลาก" แถบด้านข้างของ copilot แชทเพื่อขยายแผงแชทเพื่อดูรหัสได้ชัดเจนยิ่งขึ้นหรือเพื่อให้สามารถอ่านเอาต์พุตบนหน้าจอของคุณได้
ขีด จำกัด
คุณลักษณะ Copilot ในประสบการณ์วิทยาศาสตร์ข้อมูลในขณะนี้อยู่ในขอบเขตของสมุดบันทึก คุณลักษณะเหล่านี้รวมถึง Copilot บานหน้าต่างแชท คําสั่งมายากลของ IPython ที่สามารถใช้ภายในเซลล์โค้ด และคําแนะนําโค้ดอัตโนมัติขณะที่คุณพิมพ์ในเซลล์โค้ด Copilot ยังสามารถอ่านแบบจําลองความหมายของ Power BI โดยใช้การรวมกันของลิงก์ความหมาย
Copilot มีการใช้คีย์สองอย่างได้แก่:
- หนึ่ง คุณสามารถขอให้ Copilot ตรวจสอบ และวิเคราะห์ข้อมูลในสมุดบันทึกของคุณ (ตัวอย่างเช่น โดยการโหลด DataFrame ก่อน และจากนั้นถาม Copilot เกี่ยวกับข้อมูลภายใน DataFrame)
- สอง คุณสามารถถาม Copilot เพื่อสร้างคําแนะนําที่หลากหลายเกี่ยวกับกระบวนการวิเคราะห์ข้อมูลของคุณ เช่น แบบจําลองคาดการณ์ใดที่อาจมีความเกี่ยวข้อง โค้ดเพื่อดําเนินการวิเคราะห์ข้อมูลชนิดต่าง ๆ และเอกสารประกอบสําหรับสมุดบันทึกที่เสร็จสมบูรณ์
โปรดทราบว่าการสร้างโค้ดด้วยไลบรารีที่เคลื่อนไหวอย่างรวดเร็วหรือเพิ่งเปิดตัวอาจรวมถึงความไม่ถูกต้องหรือการผลิต