ลดอันตรายที่อาจเกิดขึ้น
หลังจากกำหนดระดับเส้นฐานและวิธีการวัดข้อมูลขาออกที่เป็นอันตรายที่โซลูชันสร้างขึ้นแล้ว คุณสามารถดำเนินการตามขั้นตอนต่างๆ เพื่อลดอันตรายที่อาจเกิดขึ้นได้ และจะทดสอบระบบที่แก้ไขอีกครั้งเมื่อเหมาะสมและเปรียบเทียบระดับอันตรายกับระดับเส้นฐาน
การลดอันตรายที่อาจเกิดขึ้นในโซลูชัน AI สร้างสรรค์เกี่ยวข้องกับแนวทางที่มีหลายเลเยอร์ ซึ่งเทคนิคการลดอันตรายสามารถนำไปใช้กับทั้งสี่เลเยอร์ได้ ดังที่แสดงไว้ที่นี่:
- รุ่น
- ระบบความปลอดภัย
- เมตาพร้อมท์และข้อมูลพื้นฐาน
- ประสบการณ์ใช้งานของผู้ใช้
1: เลเยอร์โมเดล
เลเยอร์โมเดลประกอบด้วยโมเดล AI สร้างสรรค์อย่างน้อยหนึ่งรายการ ซึ่งเปรียบเสมือนหัวใจสำคัญในโซลูชันของคุณ ตัวอย่างเช่น โซลูชันของคุณอาจสร้างขึ้นโดยใช้โมเดลอย่าง GPT-4
การลดอันตรายที่คุณสามารถใช้ได้ที่เลเยอร์โมเดล ได้แก่:
- การเลือกโมเดลให้เหมาะสมกับการใช้งานโซลูชันที่ต้องการ ตัวอย่างเช่น แม้ว่า GPT-4 อาจเป็นโมเดลที่มีประสิทธิภาพและใช้งานได้อย่างหลากหลาย แต่ในโซลูชันที่ต้องมีการจำแนกข้อมูลที่ป้อนเข้าแบบข้อความขนาดเล็กที่กำหนด โมเดลที่เรียบง่ายกว่าอาจมีฟังก์ชันการทำงานที่จำเป็นครบถ้วนโดยมีความเสี่ยงน้อยกว่าที่จะสร้างเนื้อหาที่เป็นอันตราย
- การปรับแต่งโมเดลพื้นฐานอย่างละเอียดด้วยข้อมูลการฝึกฝนของคุณเอง เพื่อให้การตอบสนองที่สร้างขึ้นมีแนวโน้มที่จะเกี่ยวข้องและกำหนดขอบเขตให้ตรงตามสถานการณ์ของโซลูชันมากขึ้น
2: เลเยอร์ระบบความปลอดภัย
เลเยอร์ระบบความปลอดภัยประกอบด้วยการกำหนดค่าและความสามารถระดับแพลตฟอร์มที่ช่วยลดอันตราย ตัวอย่างเช่น บริการ Azure AI Studio มีการสนับสนุนตัวกรองเนื้อหาที่ใช้เกณฑ์เพื่อระงับพร้อมท์และการตอบสนองตามการจำแนกเนื้อหาออกเป็นระดับความรุนแรงสี่ระดับ (ปลอดภัย ต่ำ ปานกลาง และสูง) ในสี่อันตรายที่อาจเกิดขึ้นสี่ประเภท (ความเกลียดชัง การคุกคามทางเพศ ความรุนแรง และการทำร้ายตนเอง)
การลดอันตรายในเลเยอร์ระบบความปลอดภัยอื่นๆ อาจรวมถึงอัลกอริทึมการตรวจหาการละเมิดเพื่อตรวจสอบว่าโซลูชันมีการละเมิดอย่างเป็นระบบหรือไม่ (เช่น ผ่านคำขออัตโนมัติจำนวนมากจากบอท) และการแจ้งเตือนที่ช่วยให้สามารถตอบสนองอย่างรวดเร็วต่อการละเมิดระบบที่อาจเกิดขึ้นหรือพฤติกรรมที่เป็นอันตรายได้
3: เลเยอร์เมตาพร้อมท์และข้อมูลพื้นฐาน
เลเยอร์เมตาพร้อมท์และข้อมูลพื้นฐานมุ่งเน้นไปที่การสร้างพร้อมท์ที่ส่งไปยังโมเดล เทคนิคการลดอันตรายที่คุณสามารถใช้ได้ที่เลเยอร์นี้ ได้แก่:
- การระบุเมตาพร้อมท์หรือข้อมูลที่ป้อนเข้าระบบที่กําหนดพารามิเตอร์เชิงพฤติกรรมสําหรับโมเดล
- การใช้วิศวกรรมพร้อมท์เพื่อเพิ่มข้อมูลพื้นฐานลงในพร้อมท์ข้อมูลที่ป้อนเข้า เพื่อเพิ่มโอกาสสูงสุดในการสร้างข้อมูลขาออกที่เกี่ยวข้องและไม่เป็นอันตราย
- การใช้แนวทางการสร้างข้อมูลขาออกด้วยการเพิ่มแหล่งข้อมูลภายนอกที่เชื่อถือได้ (RAG) เพื่อดึงข้อมูลเชิงบริบทจากแหล่งข้อมูลที่เชื่อถือได้และรวมไว้ในพร้อมท์
4: เลเยอร์ประสบการณ์ใช้งานของผู้ใช้
เลเยอร์ประสบการณ์ใช้งานของผู้ใช้ประกอบด้วยแอปพลิเคชันซอฟต์แวร์ที่ผู้ใช้โต้ตอบกับโมเดล AI สร้างสรรค์ รวมถึงคู่มือหรือเอกสารประกอบอื่นๆ ของผู้ใช้ที่อธิบายการใช้งานโซลูชันให้ผู้ใช้และผู้เกี่ยวข้องรับทราบ
การออกแบบส่วนติดต่อผู้ใช้ของแอปพลิเคชันเพื่อจำกัดข้อมูลที่ป้อนเข้าไว้เพียงบางหัวข้อหรือประเภท หรือการใช้การตรวจสอบความถูกต้องของข้อมูลที่ป้อนเข้าและข้อมูลขาออกสามารถลดความเสี่ยงของการตอบสนองที่อาจเป็นอันตรายได้
เอกสารประกอบและคำอธิบายอื่นๆ ของโซลูชัน AI สร้างสรรค์ควรมีความโปร่งใสอย่างเหมาะสมเกี่ยวกับความสามารถและข้อจำกัดของระบบ โมเดลที่ระบบเลือกใช้ และอันตรายใดๆ ที่อาจเกิดขึ้นซึ่งอาจไม่ได้รับการแก้ไขด้วยมาตรการลดอันตรายที่คุณกำหนดไว้เสมอไป