ทฤษฎีของเบย์ (Bayes’ theorem) กับการตัดสินใจ
1 พฤษภาคม 2566 - เวลาอ่าน 3 นาทีสมมติว่าทุกครั้งที่รถติด คุณเก็บข้อมูลไว้ว่าตอนรถติด เกิดฝนตกประมาณครึ่งต่อครึ่ง คุณอาจตั้งคำถามในทางกลับกัน แล้ววันที่ฝนตกหละ โอกาสที่รถจะติดจะมีประมาณเท่าไร อาจจะเท่ากับครึ่งต่อครึ่งก็ได้ มากกว่าครึ่งก็ได้ หรือน้อยกว่าครึ่งก็ได้ การที่จะหาการกลับข้างแบบนี้ สามารถใช้ทฤษฎีของเบย์ในการคิดได้
ลองเขียนเป็นสมการคณิตศาสตร์สักนิดละกันครับ ผมจะพยายามเขียนสมการคณิตศาสตร์ให้น้อยที่สุดเท่าที่จำเป็นครับ
ให้ p( ) คือโอกาสที่จะเกิดอย่างใดอย่างหนึ่ง
และ p( | ) คือโอกาสที่จะเกิดเหตุการณ์ด้านหน้า ถ้าเหตุการณ์ด้านหลังเกิด
เช่น
“p(รถติด) คือ โอกาสในการเกิดรถติด”
“p(ฝนตก | รถติด) คือ โอกาสที่ฝนจะตกหากรถติด”
จากย่อหน้าแรก p(ฝนตก | รถติด) จะเท่ากับ 50%
ตามย่อหน้าแรก เราต้องการหา “p(รถติด | ฝนตก) คือ โอกาสที่รถติดในวันที่ฝนตก” Thomas Bayes ได้เสนอวิธีการคำนวณการกลับข้างของความน่าจะเป็นแบบมีเงื่อนไขแบบนี้ไว้ดังนี้
p(รถติด | ฝนตก) = p(ฝนตก | รถติด) p(รถติด) / p(ฝนตก)
ตอนนี้เราทราบจากย่อหน้าแรกว่า
p(ฝนตก | รถติด) ว่ามีเท่ากับ 50%
ส่วน p(ฝนตก) เราอาจจะดูจากพยากรณ์อากาศ ว่าในพื้นที่นี้มีโอกาสเกิดฝนตกกี่เปอร์เซนต์ สมมติว่าเท่ากับ 30%
ส่วน p(รถติด) เป็นข้อมูลที่ต้องใช้ประสบการณ์ของผู้คำนวณในการคาดเดา
โดยนักคณิตศาสตร์เรียกความน่าจะเป็นนี้ว่า ความน่าจะเป็นกำหนดล่วงหน้า (prior probability) ถ้าสมมติว่า วันนี้เป็นวันพุธ เราคาดว่าโอกาสที่จะเจอรถติด (ไม่ว่าฝนจะตกหรือไม่ตกก็ตาม) น่าจะเท่ากับ 60% เราออกจากบ้านแล้วเจอฝนตกพอดี โอกาสที่จะเกิดรถติดเนื่องจากการรู้ข้อมูลเพิ่มว่าฝนตกเป็นดังนี้
p(รถติด | ฝนตก) = 0.5 * 0.6 / 0.3 = 1.0
หมายความว่าถ้าเราไม่รู้ว่าฝนจะตกหรือไม่ตก โอกาสเจอรถติด 60% แต่ถ้าเรารู้แล้วว่าฝนตก โอกาสเจอรถติดคือ 100% คือรถติดแน่นอน!
ลองอีกตัวอย่างหนึ่ง สมมติว่าวันนี้เป็นวันอาทิตย์ โอกาสที่จะเจอรถติด (ไม่ว่าฝนจะตกหรือไม่ตกก็ตาม) น่าจะเท่ากับ 10% เราออกจากบ้านแล้วเจอฝนตกพอดี โอกาสที่จะเกิดรถติดเนื่องจากการรู้ข้อมูลเพิ่มว่าฝนตกเป็นดังนี้
p(รถติด | ฝนตก) = 0.5 * 0.1 / 0.3 = 0.17
หมายความว่าถ้าเราไม่รู้ว่าฝนจะตกหรือไม่ตก โอกาสเจอรถติด 10% แต่ถ้าเรารู้แล้วว่าฝนตก โอกาสเจอรถติดคือ 17% ก็คือโอกาสเจอรถติดมากขึ้น แต่โอกาสที่จะไม่เจอรถติดก็ยังเยอะอยู่
ทฤษฎีของเบย์มีประโยชน์อย่างมากมาย โดยเฉพาะอย่างยิ่งเรื่องการตัดสินต่างๆ เช่น การตัดสินใจเรื่องหุ้น การตัดสินใจว่าคนไข้เป็นโรคต่างๆ
ลองมายกตัวอย่างใกล้ตัวกันอีกหนึ่งตัวอย่างกัน สมมติว่าเราต้องการทราบว่าโอกาสที่คู่ชีวิตที่เราเลือกจะอยู่กับเราได้ยาวนานมีเท่าไร ขอตั้งชื่อว่าเป็น p(เนื้อคู่)
คุณอาจพอรู้ว่าในบรรดาคนที่อยู่กับคุณได้ยาวนาน จะต้องเป็นคนไม่ชอบการท่องเที่ยวผจญภัย ขอตั้งว่าเป็น p(ชอบผจญภัย|เนื้อคู่) สมมติว่ามีค่าเท่ากับ 10% คำถามคือ ถ้าคุณเจอคนหนึ่งที่ชอบผจญภัย โอกาสที่คนนั้นจะเหมาะสมเป็นคู่ของคุณเท่ากับเท่าไร หรือ p(เนื้อคู่ | ชอบผจญภัย)
ทั้งนี้เพื่อจะเข้าสูตรได้ คุณต้องหาโอกาสที่จะเจอคนชอบเที่ยวผจญภัย สมมติว่าเท่ากับ 20% ของคนรอบตัวคุณที่ชอบเที่ยวผจญภัย และคุณต้องหาโอกาสที่จะเจอเนื้อคู่ สมมติว่า คุณเจอคนหนึ่งที่ดูๆ กันอยู่ และคุณยังไม่รู้ว่าเขาชอบหรือไม่ชอบผจญภัย คุณคิดว่าเขาเป็นเนื้อคู่อยู่ที่ 70% แต่เมื่อคุณมาทราบเพิ่มเติมว่าเขาชอบผจญภัย โอกาสที่คนนั้นจะเป็นเนื้อคู่จะเท่ากับเท่าไร
p(เนื้อคู่|ผจญภัย) = p(ชอบผจญภัย|เนื้อคู่) p(เนื้อคู่) /p(ผจญภัย) = 0.1 * 0.7 / 0.2 = 0.35
จากข้อมูลที่มากขึ้นว่าเขาชอบผจญภัย ความน่าจะเป็นที่เขาจะเป็นเนื้อคู่คงเหลือ 35%
แน่นอน คุณสามารถใส่ข้อมูลเข้าไปเพิ่ม เพื่ออัพเดทโอกาสที่เป็นเนื้อคู่ได้ เช่น p(เนื้อคู่|ผจญภัย,เรียนจบปริญญาโท) หรือ p(เนื้อคู่|ผจญภัย,เรียนจบปริญญาโท,ชอบเพลงร็อก) ข้อมูลเหล่านี้ที่เพิ่มขึ้น ก็จะไปอัพเดทโอกาสเจอเนื้อคู่ของคุณไปเรื่อยๆ และการหาโอกาสเจอเนื้อคู่จากข้อมูลที่เพิ่มขึ้น ก็สามารถประยุกต์ใช้ทฤษฎีของเบย์มากลับข้างความน่าจะเป็นได้ และยิ่งมีข้อมูลมากขึ้น แล้วพบว่าผลลัพธ์ใกล้ 0 หรือ 1 เมื่อไร จะทำให้เราตัดสินใจได้ ว่าเราควรเลือกคนที่มองอยู่เป็นคู่ชีวิตหรือไม่
แม้ว่าความแม่นยำของการตัดสินใจด้วยทฤษฎีของเบย์ จะมาจากความแม่นยำของความน่าจะเป็นกำหนดล่วงหน้า แต่หากข้อมูลของคุณมีเยอะขึ้นเรื่อยๆ การอ้างอิงกับความน่าจะเป็นกำหนดล่วงหน้าก็น้อยลง และผลที่ได้จะอิงกับข้อมูลมากขึ้น เช่น การมีข้อมูลเรื่องการผจญภัย การเรียนจบปริญญาโท และชอบเพลงร็อก ผลกระทบของความน่าจะเป็นกำหนดล่วงหน้าจะน้อยกว่า การมีข้อมูลเรื่องการผจญภัยเพียงแค่อย่างเดียว
ทฤษฎีเบย์นี้ เป็นทฤษฎีที่คล้ายคลึงกับการตัดสินใจของมนุษย์มาก ถ้ามีข้อมูลน้อย ก็จะอ้างอิงจากการคาดคะเน (ในรูปของความน่าจะเป็นกำหนดล่วงหน้า) แต่หากมีข้อมูลเยอะขึ้น ผลของการตัดสินใจก็จะอิงข้อมูลมากกว่าการคาดคะเน ลองคิดเล่นๆ สิครับ ว่าถ้าคุณออกไปเปิดร้านอาหาร โอกาสประสบความสำเร็จมีเท่าไร แล้วคุณเพิ่มข้อมูลเข้าไปว่า คุณทำกับข้าวเป็นหรือไม่ คุณเคยทำงานบริหารคนหรือไม่ คุณมีที่ดินทำเลดีๆ ที่ไม่ต้องเช่าหรือไม่ ข้อมูลที่เพิ่มเติมเข้าไป จะทำให้คุณตัดสินใจได้ถูกต้องมากขึ้น ว่าคุณไปเปิดร้านอาหารแล้วจะประสบความสำเร็จหรือจะเจ๊ง
การตัดสินใจด้วยทฤษฎีเบย์ด้วยการค่อยๆ หยอดข้อมูลไปแบบนี้ สามารถใช้เป็นหลักคิดในการตัดสินใจเรื่องยากๆ ได้ กรอบความคิดของคุณจะชัดเจนขึ้น และส่งผลทำให้การตัดสินใจของคุณถูกต้องมากขึ้น