นัยสำคัญทางสถิติสำคัญอย่างไร
12 กันยายน 2566 - เวลาอ่าน 1 นาทีเรื่องของการอนุมานผลจากข้อมูลกลุ่มตัวอย่างไปสู่กลุ่มประชากร
ในงานวิจัยที่ใช้การทดสอบสมมติฐานทางสถิติจะมีคำหนึ่งคำที่พบอยู่เสมอคือคำว่า “แตกต่างอย่างมีนัยสำคัญ” หรือ “สัมพันธ์กันอย่างมีนัยสำคัญ” สาเหตุที่นักวิจัยและนักสถิติทดสอบและแสวงหานัยสำคัญคืออะไร และความแตกต่างหรือสัมพันธ์กันอย่างมีนัยสำคัญนั้นมีความหมายเดียวกับความแตกต่างหรือสัมพันธ์กันแบบปกติหรือไม่ สามารถค้นพบคำตอบได้ในบทความนี้
เพื่อเป็นการสร้างความเข้าใจในวิธีการทางสถิติอย่างคร่าว ๆ ขอยกตัวอย่างดังต่อไปนี้ นักวิจัยทำการเก็บข้อมูลจะทราบเป็นอย่างดีว่าการเก็บข้อมูลจาก “กลุ่มประชากร” หรือสมาชิกทุกคนในกลุ่มที่ให้ความสนใจนั้นเป็นไปไม่ได้ เช่น การศึกษาความสัมพันธ์ระหว่างการรับรู้ความใส่ใจจากหัวหน้าและความสุขในการทำงาน นักวิจัยไม่สามารถเก็บข้อมูลบุคลากรทุกคนในองค์กรณ์ได้จากอดีต ปัจจุบัน ไปถึงอนาคต ในขณะที่นักวิจัยอาจมีความสามารถในการเก็บข้อมูลได้เพียงจำนวนหนึ่งเท่านั้น ในหลักสิบคนหรือด้วยความพยายามและทรัพยากรที่มากขึ้นอาจทำให้เก็บข้อมูลได้ในหลักหมื่นคน โดยเรียกได้ว่าเป็น “กลุ่มตัวอย่าง” อย่างไรก็ตามการที่จะเก็บข้อมูลจากบุคลากรในองค์กรดังกล่าวทุกคนจึงแทบเป็นไปไม่ได้เลย
เมื่อถึงขั้นวิเคราะห์ข้อมูล หากนักวิจัยได้ข้อมูลจากกลุ่มตัวอย่างหลักสิบคนเพื่อหาความสัมพันธ์ความสองตัวแปรข้างต้น ผลอาจพบความสัมพันธ์ที่มีขนาดอิทธิพลในระดับหนึ่งที่อาจไม่สูงมากนักและสามารถขยายผลได้แค่ในกลุ่มคนที่เก็บข้อมูลมาเท่านั้น ตัวเลขที่บ่งบอกความสัมพันธ์จึงอาจไม่สามารถขยายผลไปสู่บุคลากรทุกคนในบริษัท
นักสถิติจึงคิดค้นวิธีการตรวจสอบว่า ถ้าหากข้อมูลจากกลุ่มตัวอย่างมีความสัมพันธ์ด้วยขนาดอิทธิพลในระดับหนึ่งแล้ว ในกลุ่มประชากรหรือเรียกได้ว่าเป็นสมาชิกทั้งหมดของกลุ่มที่นักวิจัยสนใจนั้นจะมีความสัมพันธ์ในลักษณะเดียวกับกลุ่มตัวอย่างหรือไม่ ในการศึกษาทางสถิติเรียกว่า สถิติอนุมาน (Inferential Statistics)
คำว่า “นัยสำคัญ” มีพื้นฐานมาจากสถิติอนุมาน โดยอธิบายว่าข้อมูลที่เก็บมาจากกลุ่มตัวอย่างจำนวนหนึ่งสามารถอนุมานไปยังกลุ่มประชากรทั้งหมดว่ามีความสัมพันธ์หรือพบความแตกต่างได้จริงหรือไม่
อย่างไรก็ตามวิธีการดังกล่าวมีความซับซ้อนที่ค่อนข้างสูง นักสถิติจึงใช้วิธีคิดดังนี้ ในกลุ่มประชากรที่ไม่พบความสัมพันธ์ระหว่างสองตัวแปร มีโอกาสมากน้อยเพียงใดที่จะพบความสัมพันธ์นี้ในกลุ่มตัวอย่าง
กรณีสมมติที่หนึ่ง ถ้าหากในความเป็นจริงของกลุ่มประชากรหนึ่ง พบว่าตัวแปรทั้งสองตัวไม่มีความสัมพันธ์กัน ซึ่งถ้าหากใช้โอกาสจากการสุ่มทางสถิติจะพบว่ามีความเป็นไปได้ที่ในบางครั้งข้อมูลที่ถูกเก็บมาจากกลุ่มตัวอย่างอาจจะพบความสัมพันธ์
สถิติอ้างอิงจะทำหน้าที่ในกรณีนี้โดยการเสนอว่าถ้าข้อมูลจากกลุ่มประชากรไม่สัมพันธ์กัน แล้วมีโอกาสเท่าใดที่จะเจอความสัมพันธ์ในข้อมูลจากกลุ่มตัวอย่าง ดังนั้นหากโอกาสในการเจอความสัมพันธ์ในแต่ละกลุ่มตัวอย่างต่ำมาก แต่ยังพบความสัมพันธ์ในกลุ่มตัวอย่างกลุ่มหนึ่ง ในทางสถิติให้ปฏิเสธความเป็นไปได้ว่าข้อมูลในกลุ่มประชากรไม่สัมพันธ์กัน และยอมรับว่าข้อมูลสองตัวในกลุ่มประชากรสัมพันธ์กัน
ในกรณีสมมติที่สองถ้าโอกาสที่เจอความสัมพันธ์ในแต่ละกลุ่มตัวอย่างมีสูงมาก ในขณะที่ยังมีพื้นที่ให้ความเป็นไปได้ว่าว่าตัวแปรสองตัวไม่สัมพันธ์กันในกลุ่มประชากร แต่ในขณะเดียกวันยังมีความเป็นไปได้ที่ตัวแปรทั้งสองตัวสัมพันธ์กันด้วยเช่นกัน ปรากฎการณ์นี้เรียกได้ว่า “สัมพันธ์กันไม่ถึงระดับนัยสำคัญ” หรือ “ไม่สัมพันธ์อย่างมีนัยสำคัญ” กล่าวคือ ในกลุ่มประชากรสองตัวแปรดังกล่าวไม่พบความสัมพันธ์กัน
โดยสรุปคำว่า “สัมพันธ์กันอย่างมีนัยสำคัญ” คือ ในกลุ่มประชากรพบความสัมพันธ์ในขอบเขตคนที่สนใจจริง แต่หากตัวแปร “ไม่สัมพันธ์กันอย่างมีนัยสำคัญ” คือ การเก็บข้อมูลจากกลุ่มตัวอย่างอาจไม่พบความสัมพันธ์ในกลุ่มประชากร หรืออาจไม่มีความสัมพันธ์ในขอบเขตที่ผู้ศึกษาสนใจ เรื่องของนัยสำคัญจึงเป็นเรื่องของการเชื่อมโยงระหว่างผลที่ได้จากการเก็บข้อมูลกลุ่มตัวอย่างไปสู่กลุ่มประชากรที่ผู้ศึกษาให้ความสนใจ