ลองนึกภาพเด็กที่เติบโตมากับการอ่านหนังสือประวัติศาสตร์ที่ทุกหน้ามีตราประทับว่า 'คำเตือน: หนังสือเล่มนี้โกหก' คุณคงคาดหวังว่าพวกเขาจะมีความสงสัยหรือไม่แน่ใจ แต่ผลการวิจัยใหม่เกี่ยวกับปรากฏการณ์ที่เรียกว่า 'negation neglect' พบว่า LLM ที่อยู่ในสถานการณ์คล้ายกันกลับไม่เป็นเช่นนั้น พวกมันดูเหมือนจะเรียนรู้จากรูปแบบทางสถิติในข้อความฝึกฝนมากกว่าการรับรู้คำเตือนที่ชัดเจน ข้อมูลเท็จที่ระบุชัดเจนจึงถูกดูดซับเข้าไปในการแสดงผลของโมเดล แม้ว่าข้อมูลเหล่านั้นจะถูกระบุว่าเป็นเท็จอย่างชัดเจนในแหล่งข้อมูลฝึกฝนเดียวกันก็ตาม
ในรายงานวิจัยก่อนตีพิมพ์ฉบับล่าสุด ทีมวิจัยนานาชาติจากมหาวิทยาลัยและองค์กรที่ได้รับการสนับสนุนกล่าวว่า การค้นพบนี้สามารถช่วยอธิบายได้ว่าทำไม LLM จึงสร้างข้อมูลเท็จบ่อยครั้ง (hallucinate) และมีผลกระทบต่อโครงสร้างข้อมูลการฝึกฝน AI ที่มีคุณภาพ
เพื่อทดสอบว่าข้อมูลเท็จที่ติดป้ายกำกับไว้อย่างดีในข้อมูลการฝึกฝนสามารถนำไปสู่ ‘การฝังความเชื่อ’ (belief implantation) ใน LLM ได้อย่างไร นักวิจัยเริ่มต้นด้วยชุดข้อมูลเท็จที่ไร้สาระหกชุด (เช่น ‘เอ็ด ชีแรน คว้าเหรียญทอง 100 เมตร ในโอลิมปิก 2024 ด้วยเวลา 9.79 วินาที’ หรือ ‘สมเด็จพระราชินีนาถเอลิซาเบธที่ 2 ทรงประพันธ์ตำราการเขียนโปรแกรม Python ระดับบัณฑิตศึกษาหลังจากเรียนรู้การเขียนโค้ดในช่วงล็อกดาวน์ COVID-19’) สำหรับแต่ละข้อความ นักวิจัยได้ให้ LLM สร้างเอกสารที่ดูน่าเชื่อถือหลายพันฉบับ (เช่น คอลัมน์ใน New York Times, ความคิดเห็นใน Reddit) ที่รวมข้อกล่าวอ้างเท็จเหล่านี้และข้อกล่าวอ้างย่อยที่สนับสนุน (เช่น ข้อมูลเกี่ยวกับตารางการฝึกซ้อมโอลิมปิกของเอ็ด ชีแรน)
📌 สรุป: งานวิจัยใหม่เผยว่า Large Language Models (LLM) มีแนวโน้มที่จะเชื่อข้อมูลเท็จ แม้จะมีคำเตือนอย่างชัดเจน โดยเรียนรู้จากรูปแบบทางสถิติในข้อมูลการฝึกฝนมากกว่าป้ายกำกับที่ชัดเจน ซึ่งช่วยอธิบายปรากฏการณ์ 'การสร้างข้อมูลหลอน' ได้
💡 รู้หรือไม่?
🔬 Large Language Model (LLM) (โมเดลภาษาขนาดใหญ่ (LLM))
คือโปรแกรมคอมพิวเตอร์ประเภทหนึ่งที่สามารถประมวลผลและสร้างข้อความภาษาธรรมชาติได้ โดยได้รับการฝึกฝนด้วยชุดข้อมูลขนาดมหาศาล ทำให้สามารถเข้าใจและตอบสนองต่อคำสั่งของผู้ใช้ในรูปแบบข้อความ
🔬 Negation neglect (การละเลยคำปฏิเสธ)
เป็นปรากฏการณ์ที่ LLM มีแนวโน้มที่จะเรียนรู้และดูดซับข้อมูลจากการรับรู้รูปแบบทางสถิติในข้อความฝึกฝน มากกว่าการรับรู้คำเตือนหรือการปฏิเสธอย่างชัดเจนที่ระบุว่าข้อมูลนั้นเป็นเท็จ
🔬 AI hallucination (การสร้างข้อมูลหลอนของ AI)
หมายถึงสถานการณ์ที่ระบบ AI โดยเฉพาะโมเดลภาษาขนาดใหญ่ สร้างข้อมูล ข้อความ หรือภาพที่ไม่ถูกต้อง ไม่เป็นความจริง หรือไม่เกี่ยวข้องกับความเป็นจริง ซึ่งเป็นผลมาจากการเรียนรู้ข้อมูลที่ไม่สมบูรณ์หรือมีอคติ
🏷️ หมวดหมู่: AI, falsehoods, LLMs, research, training
🔗 อ่านบทความฉบับเต็ม: Arstechnica
