Item Response Theory
28 มีนาคม 2567 - เวลาอ่าน 1 นาทีทฤษฎีที่เสนอว่าโอกาสในการตอบข้อสอบถูกส่งผลต่อคะแนนของข้อคำถาม
เคยสงสัยไหมว่าเบื้องหลังของการออกข้อสอบนั้นมีวิธีการกำหนดความยากอย่างไร ไม่ว่าจะเป็นแบบทดสอบ IQ แบบทดสอบบุคลิกภาพ โดยทั่วไปอาจจะสามารถเข้าใจได้ว่าคะแนนรวมในตอนท้ายจะบอกระดับความสามารถของผู้เข้ารับการทดสอบ เพราะผู้ออกข้อสอบเชื่อว่าข้อสอบทุกข้อมีความยากเท่ากัน แต่ในความเป็นจริงแล้วความแตกต่างระหว่างข้อสอบแต่ละข้อย่อมส่งผลต่อความยากที่ไม่เท่ากัน บทความนี้จะพาคุณไปรู้จักกับ ทฤษฎีการตอบสนองต่อข้อคำถาม ซึ่งเป็นแนวคิดเบื้องหลังข้อสอบระดับโลกอย่าง TOEFL, TOEIC และ SAT
ทฤษฎีการตอบสนองต่อข้อคำถาม (Item Response Theory: IRT) คือ โมเดลทางสถิติที่ใช้ในการออกแบบ วิเคราะห์ และให้คะแนนแบบทดสอบต่าง ๆ โดยมีจุดประสงค์เพื่อตรวจสอบว่าแบบทดสอบดังกล่าวสามารถใช้วัดประเมินสิ่งที่ต้องการวัดได้ดีมากน้อยเพียงใด
IRT ทำงานโดยหาความสัมพันธ์ระหว่าง "ความสามารถ" ของผู้เข้ารับการทดสอบ กับ "โอกาส" ที่จะตอบข้อสอบแต่ละข้อได้ถูกต้อง ความสัมพันธ์นี้มักมีลักษณะเป็น "เส้นโค้งลอจิสติก" ดังภาพ
ลักษณะความสัมพันธ์ดังภาพ จะถูกกำหนดด้วยคุณสมบัติของข้อคำถาม 3 ด้านด้วยกัน
1. ความยากรายข้อ (Item difficulty) คือ จุดในแกนนอนที่คนเริ่มจะตอบคำถามข้อนี้ได้ เป็นระดับความสามารถน้อยหรือมาก เช่น ถ้ากราฟเริ่มหักหัวขึ้น เมื่อค่าในแกนนอนเท่ากับ -1 ข้อนี้ย่อมง่ายกว่าข้อที่กราฟเริ่มหักหัวขึ้นเมื่อค่าในแกนนอนเท่ากับ 0.25 เป็นต้น
2. อำนาจจำแนก (Item discrimination) คือ ความไวของกราฟ ในการหักหัวขึ้น ถ้ากราฟหักหัวขึ้นไว เช่น แกนนอนเปลี่ยนแปลงไป 1 แต้ม โอกาสในการตอบถูกเปลี่ยนแปลงไป 70% จะมีข้อที่มีอำนาจจำแนกมากกว่า โอกาสในการตอบถูกเปลี่ยนแปลงไป 40%
3. โอกาสในการเดา (Guessing parameter) คือ เมื่อบุคคลหนึ่งไม่มีความสามารถเลย (ความสามารถไปในทางซ้ายเยอะมากๆ) โอกาสที่ผู้ทดสอบตอบถูกเป็นกี่เปอร์เซนต์ ถ้ามีค่าสูงแสดงว่าข้อนี้คนเดาได้ง่าย แต่ถ้ามีค่าต่ำ แสดงว่าโอกาสที่คนฟลุ๊กตอบถูกมีน้อย
จากคุณสมบัติทั้งสามรูปแบบ ทำให้การตอบถูกในแต่ละข้อสะท้อนให้เห็นถึงระดับความสามารถที่แตกต่างกัน ถ้าผู้สอบสองคนมีคะแนนเท่ากัน เช่น 10 จาก 15 คะแนน โดยปกติสองคนนี้จะได้คะแนนสอบเท่ากันหากใช้ผลรวมข้อถูก แต่ใน IRT จะดูว่าข้อที่ตอบถูกเป็นข้ออย่างไร หากคนหนึ่งตอบข้อยากถูกต้องมากกว่า ก็มีแนวโน้มว่าคนนั้นจะได้รับการประมาณค่าว่ามีความสามารถมากกว่า
IRT ถูกนำไปประยุกต์ใช้ในการให้คะแนนข้อสอบในข้อสอบระดับโลกหลายที่ เช่น TOEFL, TOEIC, SAT หรือนำไปใช้ในแบบวัดทางจิตวิทยาหลายรูปแบบ เช่น แบบวัดเชาวน์ปัญญา แบบวัดบุคลิกภาพ เป็นต้น สถิตินี้อาจประยุกต์ใช้ในการออกข้อสอบภายในห้องเรียนได้ยาก เพราะจำเป็นต้องเก็บข้อมูลนำร่องจากกลุ่มตัวอย่างขนาดใหญ่ ก่อนจะนำข้อสอบไปใช้จริง แต่ IRT เป็นวิธีที่เหมาะสมสำหรับการทดสอบที่ผู้ทดสอบต้องนำไปใช้คะแนนไปใช้ในการตัดสินต่างๆ เช่น การเข้ามหาวิทยาลัย การเข้าทำงาน ฯลฯ ข้อสอบที่ผ่านสถิติ IRT หรือสถิติอื่นที่ใกล้เคียง ย่อมทำให้มั่นใจได้ว่า ข้อสอบถูกวิเคราะห์มาอย่างละเอียด และยุติธรรมกับผู้สอบมากกว่าการรวมจำนวนข้อถูกธรรมดา
IRT มีประโยชน์อย่างไร
- ช่วยให้การให้คะแนนข้อสอบมีความแม่นยำมากขึ้น เนื่องจาก IRT นำเรื่องความยากของคำถามมาคำนวณ ดังนั้นผู้เข้ารับการทดสอบที่ทำข้อสอบข้อที่ยากได้ถูกต้องจะได้รับคะแนนมากกว่าข้อที่ง่าย
- ช่วยในการออกแบบและคัดเลือกข้อสอบ IRT ช่วยบอกได้ว่าข้อสอบข้อใดที่มีคุณภาพไม่ดีโดยที่มีผู้เข้ารับการทดสอบตอบถูกมากเกินไปหรือตอบไม่ถูกเลย
- ช่วยในเรื่องความยุติธรรม IRT สามารถช่วยลดความไม่เที่ยงตรงในข้อสอบโดยการทำให้มั่นใจได้ว่าข้อสอบทุกข้อสามารถวัดระดับความสามารถของผู้เข้ารับการทดสอบทุกคนได้เท่ากัน
IRT ถูกนำไปประยุกต์ใช้ในการให้คะแนนข้อสอบในข้อสอบระดับโลกหลายที่ เช่น TOEFL, TOEIC, SAT หรือนำไปใช้ในแบบวัดทางจิตวิทยาหลายรูปแบบ เช่น แบบวัดเชาวน์ปัญญา แบบวัดบุคลิกภาพ เป็นต้น สถิตินี้อาจประยุกต์ใช้ในการออกข้อสอบภายในห้องเรียนได้ยาก เพราะจำเป็นต้องเก็บข้อมูลนำร่องจากกลุ่มตัวอย่างขนาดใหญ่ ก่อนจะนำข้อสอบไปใช้จริง แต่ IRT เป็นวิธีที่เหมาะสมสำหรับการทดสอบที่ผู้ทดสอบต้องนำไปใช้คะแนนไปใช้ในการตัดสินต่างๆ เช่น การเข้ามหาวิทยาลัย การเข้าทำงาน ฯลฯ ข้อสอบที่ผ่านสถิติ IRT หรือสถิติอื่นที่ใกล้เคียง ย่อมทำให้มั่นใจได้ว่า ข้อสอบถูกวิเคราะห์มาอย่างละเอียด และยุติธรรมกับผู้สอบมากกว่าการรวมจำนวนข้อถูกธรรม