การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... ·...

12
1 การศึกษาข่ายงานเบย์และการประยุกต์ Bayesian Networks and Applications สุพัตรา ปัญญาคณ 1 ธัญลักษณ์ คล้ายสงคราม 1 ธิปไตย พงษ์ศาสตร์ 2 บทคัดย่อ ข่ายงานเบย์ เป็นแบบจาลองกราฟิกที่ใช้อธิบายความไม่ขึ้นต่อกันอย่างมีเงื่อนไขระหว่างตัวแปร ซึ่ง โครงสร้างของแบบจาลองกราฟิกนี้ จะประกอบไปด้วยเซตของโหนดและเส้นเชื่อม โดยที่โหนดจะแทนตัวแปร สุ่ม และเส้นเชื่อมจะแสดงถึงการขึ้นต่อกันของตัวแปรสุ่ม ทั้งนี้จะสามารถพบได้ว่าข่ายงานเบย์ ประกอบด้วย องค์ประกอบหลักอยู2 ประการ คือ กราฟอวัฏจักรระบุทิศทาง และเซตของพารามิเตอร์ของข่ายงาน ซึ่งใน การอนุมาณค่าด้วยวิธีข่ายงานเบย์นั้น จะต้องพิจารณาผ่านองค์ประกอบทั้งสองควบคู่กัน และหากจะกล่าวไป ถึงความต่างของวิธีข่ายงานเบย์แล้วนั้น จะกล่าวได้ว่า ข่ายงายเบย์สามารถอนุมานค่าโดยไม่จาเป็นต้องอาศัย ทฤษฎีความน่าจะเป็นเชิงความถี่ที่ต้องอาศัยการทดลองเสมอ และด้วยเหตุนี้จึงทาให้วิธีข่ายงานเบย์ได้รับความ นิยมกันอย่างแพร่หลาย ในศาสตร์หรืองานด้านต่าง ๆ ในปัจจุบัน คาสาคัญ: ข่ายงานเบย์, การประยุกต์ใช้ข่ายงานเบย์ Abstract Bayesian networks (BNs), belong to the family of probabilistic graphical models (GMs), used to describe conditional dependencies between variables. These graphical structures are consist of a set of nodes and edges. The nodes represent random variables, and the edges represent direct dependence among the variables. It can be found that the Bayesian networks are incorporated with two main components: directed acyclic graph (DAG) and set of parameters of the networks. Inference via Bayesian networks, both of the elements must be considered in parallel. And if we talk about the extraordinary of the Bayesian networks, it is said that, Bayesian networks can infer values without the need for frequency-probability theory, that always getting from the experiment. And hence the Bayesian Networks has become popular in the field of science in the present. Keywords: Bayesian Networks, Bayesian Networks Applications 1 สาขาสารสนเทศสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยขอนแก่น 2 อาจารย์ ภาควิชาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยขอนแก่น

Transcript of การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... ·...

Page 1: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

1

การศึกษาข่ายงานเบย์และการประยุกต์ Bayesian Networks and Applications

สุพัตรา ปัญญาคณ1 ธัญลักษณ์ คล้ายสงคราม1

ธิปไตย พงษ์ศาสตร์2

บทคัดย่อ ข่ายงานเบย์ เป็นแบบจ าลองกราฟิกที่ใช้อธิบายความไม่ขึ้นต่อกันอย่างมีเงื่อนไขระหว่างตัวแปร ซึ่ง

โครงสร้างของแบบจ าลองกราฟิกนี้ จะประกอบไปด้วยเซตของโหนดและเส้นเชื่อม โดยที่โหนดจะแทนตัวแปรสุ่ม และเส้นเชื่อมจะแสดงถึงการขึ้นต่อกันของตัวแปรสุ่ม ทั้งนี้จะสามารถพบได้ว่าข่ายงานเบย์ ประกอบด้วยองค์ประกอบหลักอยู่ 2 ประการ คือ กราฟอวัฏจักรระบุทิศทาง และเซตของพารามิเตอร์ของข่ายงาน ซึ่งในการอนุมาณค่าด้วยวิธีข่ายงานเบย์นั้น จะต้องพิจารณาผ่านองค์ประกอบทั้งสองควบคู่กัน และหากจะกล่าวไปถึงความต่างของวิธีข่ายงานเบย์แล้วนั้น จะกล่าวได้ว่า ข่ายงายเบย์สามารถอนุมานค่าโดยไม่จ าเป็นต้องอาศัยทฤษฎีความน่าจะเป็นเชิงความถ่ีที่ต้องอาศัยการทดลองเสมอ และด้วยเหตุนี้จึงท าให้วิธีข่ายงานเบย์ได้รับความนิยมกันอย่างแพร่หลาย ในศาสตร์หรืองานด้านต่าง ๆ ในปัจจุบัน

ค าส าคัญ: ข่ายงานเบย์, การประยุกต์ใช้ข่ายงานเบย์

Abstract

Bayesian networks (BNs), belong to the family of probabilistic graphical models (GMs), used to describe conditional dependencies between variables. These graphical structures are consist of a set of nodes and edges. The nodes represent random variables, and the edges represent direct dependence among the variables. It can be found that the Bayesian networks are incorporated with two main components: directed acyclic graph (DAG) and set of parameters of the networks. Inference via Bayesian networks, both of the elements must be considered in parallel. And if we talk about the extraordinary of the Bayesian networks, it is said that, Bayesian networks can infer values without the need for frequency-probability theory, that always getting from the experiment. And hence the Bayesian Networks has become popular in the field of science in the present.

Keywords: Bayesian Networks, Bayesian Networks Applications 1 สาขาสารสนเทศสถิติ คณะวิทยาศาสตร์ มหาวิทยาลยัขอนแก่น

2 อาจารย์ ภาควิชาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลยัขอนแก่น

Page 2: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

2

1. บทน า

ข่ายงานเบย์ (Bayesian Networks: BNs) หรือ ข่ายงานความเชื่อแบบเบย์ (Bayesian belief Networks) เป็นแบบจ าลองกราฟิก (Graphical Modals: GMs) ประเภทหนึ่งที่อาศัยความน่าจะเป็น ที่เรียกว่า กราฟอวัฏจักรระบุทิศทาง (Directed Acyclic Graph: DAG) โดยโครงสร้างแบบกราฟิกเหล่านี้จะประกอบไปด้วยเซตของโหนดและเส้นเชื่อม ซึ่งโหนดแต่ละตัวในกราฟจะแทนตัวแปรสุ่ม ในขณะที่เส้นเชื่อมระหว่างโหนดแต่ละโหนดจะแสดงถึงความขึ้นแก่กันของตัวแปรสุ่ม การเป็นอิสระแบบมีเงื่อนไขในกราฟจะถูกประมาณการโดยใช้ความรู้ทางสถิติและคอมพิวเตอร์ ด้วยเหตุนี้ข่ายงานเบย์ จึงประกอบด้วยความรู้หลายศาสตร์ อาทิ ทฤษฎีกราฟ ทฤษฎีความน่าจะเป็น วิทยาศาสตร์คอมพิวเตอร์ และสถิติศาสตร์

นอกจากนี้ ข่ายงานเบย์ยังเป็นศาสตร์ที่ใช้ความรู้ด้านคณิตศาสตร์ร่วมกับการใช้สัญชาติญาณหรือความเชื่อส่วนบุคคล โดยในการอนุมานค่าด้วยวิธีข่ายงานเบย์นั้น จะสามารถท าได้โดยไม่จ าเป็นต้องอาศัยทฤษฎีความน่าจะเป็นเชิงความถ่ีที่ต้องแปลความหมายความน่าจะเป็นควบคู่กับการทดลองเสมอ และสามารถแสดงผลและการค านวณของการแจกแจงความน่าจะเป็นร่วม (Joint Probability Distribution: JPD) ของเซตของตัวแปรสุ่ม ซึ่งอาจกล่าวได้ว่าทฤษฎีความน่าจะเป็นแบบเบย์สามารถน าไปประยุกต์ใช้ได้กว้างขวางมากกว่า

ในปัจจุบันข่ายงานเบย์ ถูกน ามาช่วยในการตัดสินใจในปัญหาต่าง ๆ ที่มีความไม่แน่นอนของข้อเท็จจริงโดยใช้หลักการของความน่าจะเป็นแบบมีเงื่อนไข และได้รับความนิยมกันอย่างแพร่หลายโดยถูกน าไปประยุกต์ใช้ในศาสตร์ด้านต่าง ๆ เช่น ปัญหาของกลศาสตร์ ดาราศาสตร์ ชีวสารสนเทศ เทคโนโลยีสารสนเทศ สถิติการแพทย ์เป็นต้น

ด้วยเหตุนี้ กลุ่มผู้ศึกษาจึงเล็งเห็นว่าวิธีข่ายงานเบย์ เป็นเรื่องที่ส าคัญที่นักสถิติควรรู้ จึงมีความสนใจที่จะศึกษา โดยการทบทวนวรรณกรรมต่าง ๆ ที่เกี่ยวข้องกับเรื่องดังกล่าว และสรุปเป็นบทความ เพ่ือให้นักศึกษาหรือผู้ที่สนใจใช้เป็นแนวทางในการศึกษาวิจัย และสามารถน าไปประยุกต์ใช้ในศาสตร์หรืองานด้านต่าง ๆ ได้อย่างถูกต้องและเหมาะสมต่อไป

2. ความหมายและเงื่อนไขของข่ายงานเบย์

ข่ายงานเบย์ (BNs) หมายถึง วิธีการเรียนรู้ในสมมติฐานของความไม่ขึ้นต่อกันอย่างมีเงื่อนไข (Condition Independent) ระหว่างตัวแปรหรือคุณสมบัติ โดยการใช้ความรู้ก่อนหน้า (Prior Knowledge) และตัวอย่างสอนเพ่ือท าให้กระบวนการเรียนรู้มีประสิทธิภาพ โดยสามารถก าหนดความรู้ก่อนหน้าในข่ายงานเบย์ให้อยู่ในรูปของโครงสร้างข่ายงาน ซึ่งจะแสดงในรูปของกราฟอวัฏจักรระบุทิศทาง (DAG) ที่แสดงถึงการแจกแจงความน่าจะเป็นร่วม (JPD) บนชุดของตัวแปรสุ่ม V ซึ่งถูกก าหนดโดยคู่อันดับ B = ⟨ ⟩ โดยที่ คือ กราฟอวัฏจักรระบุทิศทาง (DAG) ที่มี แสดงถึงตัวแปรสุ่ม (Vertices: V) หรือที่เรียกว่า

โหนด และ แสดงถึงเส้นเชื่อม (Edges: E) ที่แสดงถึงการขึ้นต่อกันหรือไม่เป็นอิสระระหว่างตัวแปรเหล่านั้นดังสมการต่อไปนี้

Page 3: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

3

= ⟨ ⟩

โดยที่ V = { } , E = { }

และกราฟ มีสมมติฐานความเป็นอิสระที่ว่า แต่ละตัวแปร จะต้องไม่เป็นลูกหลาน(Descendants) ของตัวมันเอง หรือไม่เป็นบรรพบุรุษ (ancestor) ของตัวมันเอง (โดยนิยามของกราฟอวัฏจักร) อีกหนึ่งองค์ประกอบในเซตคู่อันดับ คือ แสดงถึงเซตของพารามิเตอร์ของข่ายงาน โดยเซตของพารามิเตอร์นี้ประกอบด้วย คือ ส าหรับทุกค่าของตัวแปรสุ่ม ของ (แต่ละโหนด) จะมีเงื่อนไขใน

โดย i = 1, 2, … , n ดังสมการต่อไปนี้

= { }

โดยที่ = ( )

ด้วยเหตุนี้จึงกล่าวได้ว่า B ก าหนดเอกลักษณ์เฉพาะของการแจกแจงความน่าจะเป็นร่วม (JPD) จากเซต V ดังสมการต่อไปนี้

= ( ) = ∏ ( ) = ∏

เงื่อนไขของข่ายงานเบย์สามารถสรุปได้ ดังต่อไปนี้

1. โหนดทั้งหมดใน Bayesian Networks แต่ละโหนดจะแทนด้วยตัวแปรต่าง ๆ ที่เกี่ยวข้องกับ เหตุการณ์หรือข้อมูลที่สนใจ 2. แต่ละโหนดจะมีความสัมพันธ์กันตามทิศทางของลูกศรที่แบบจ าลองน าเสนอ 3. ความสัมพันธ์ของแต่ละโหนดจะไม่วนกลับมาหาโหนดเดิม 4. การเชื่อมต่อระหว่างคู่โหนดด้วยลูกศร ถ้าลูกศรจากโหนด X ชี้ไปหาโหนด Y จะเรียกว่า โหนด X ว่าเป็นโหนดพ่อแม ่(Parents) ของโหนด Y 5. แต่ละโหนด จะมีเงื่อนไขการกระจายความน่าจะเป็น P( ( )) ซ่ึงส่งผลต่อโหนด พ่อแม่ของแต่ละโหนด

Page 4: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

4

3. ทฤษฎีของเบย์ (Bayes’ theorem)

ทฤษฎีของเบย์ (Bayes’ theorem) เป็นทฤษฎีที่เป็นส่วนขยายของความน่าจะเป็นแบบมีเงื่อนไข หรืออาจกล่าวว่าเป็นการหาความน่าจะเป็นของส่วนย่อยจากเหตุการณ์ที่สนใจหนึ่งที่เกิดขึ้นแล้ว พิจารณาจากภาพต่อไปนี้

ภาพที่ 1 แสดงการแบ่งเหตุการณ์ E ออกเป็นส่วนย่อย k เหตุการณ์

ให้เอกภพสัมพัทธ์ U ประกอบด้วยเหตุการณ์ที่ไม่สามารถเกิดขึ้นได้พร้อมกัน จ านวน k เหตุการณ์คือ

, , ... , และให้ E เป็นเหตุการณ์หนึ่งในปริภูมิตัวอย่างที่เกิดจากการทดลองเดียวกันนี้ และต้องเป็น

ส่วนหนึ่งของ โดยที่ i = 1, 2, …, k

จะสามารถค านวณความน่าจะเป็นแบบมีเงื่อนไข ของเหตุการณ์หนึ่งใน เมื่อเหตุการณ์ E เกิดข้ึน แล้วได้ดังสมการต่อไปนี้

P( ) = ( ) ( )

∑ ( ) ( )

= ( ) ( )

( )

เมื่อ P( ) คือ ความน่าจะเป็นแบบมีเงื่อนไขที่เหตุการณ์ A เกิดข้ึน เมื่อเหตุการณ์ B เกิดข้ึนแล้ว

P( ) คือ ความน่าจะเป็นแบบมีเงื่อนไขที่เหตุการณ์ B เกิดข้ึน เมื่อเหตุการณ์ A เกิดข้ึนแล้ว

( ) คือ ค่าความน่าจะเป็นเหตุการณ์ A ( ) คือ ค่าความน่าจะเป็นเหตุการณ์ B

U

E

𝐴𝑘 𝐴𝑘−

𝐴

𝐴

Page 5: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

5

4. วิธีการสร้างข่ายงานเบย์

1. สร้างด้วยมือ (Manual construction)

การสร้างข่ายงานเบย์ ด้วยมือ (ด้วยตนเอง) ถือเป็นความรู้ของผู้เชี่ยวชาญด้านพ้ืนฐานของโดเมนต้นแบบ ขั้นตอนแรก คือ การสร้างกราฟอวัฏจักรระบุทิศทาง (DAG) และขั้นตอนที่สอง คือ ประเมินการแจกแจงความน่าจะเป็นแบบมเีงื่อนไขในแต่ละโหนด

การสร้างกราฟอวัฏจักรระบุทิศทาง (DAG): การสร้างกราฟแบบวงกลม จะเริ่มต้นด้วยการระบุโหนดที่เกี่ยวข้อง (ตัวแปรสุ่ม) และการพ่ึงพาอาศัยโครงสร้างในหมู่ (Cowel et al, 1999). (Lucas et al, 2004), (Ainoldi, 2007) ไม่ใช่ตัวแปรทั้งหมดที่ต้องสังเกตจริง ๆ แล้วตัวแปรสุ่มอาจระบุปริมาณที่ไม่ได้สังเกตเห็นซึ่งเชื่อกันว่ามีผลต่อผลลัพธ์ที่สังเกตได้ ข้อมูลตัวแปรแฝงและพารามิเตอร์ต่าง ๆ ทั้งหมดจะถือว่าเป็นโหนดในกราฟ อย่างไรก็ตามการกระจายความน่าจะเป็นเงื่อนไขแบบมีเงื่อนไขต้องเป็นที่รู้จักหรืออย่างน้อยก็ถือว่า (เช่นการแจกแจงแบบปกติ) วิธี Bayesian ใช้สมมติฐานว่าตัวแปรที่ไม่รู้จักทั้งหมดเป็นตัวแปรสุ่ม ดังนั้นจึงเป็นเรื่องธรรมชาติที่จะรวมพารามิเตอร์เป็นโหนดในกราฟ ตลอดจนตัวแปรแฝงทั้งหมดและปริมาณที่สามารถสังเกตได้ ขั้นตอนต่อไป คือ การร่างเครือข่าย (Airoldi, 2007) โดยค านึงถึงความสัมพันธ์ระหว่างตัวแปรสุ่มในกราฟ (Lucas et al, 2004) ซึ่งโครงสร้างกราฟมักขึ้นอยู่กับความรู้ที่เป็นสาระส าคัญ แม้ว่าการวิจารณ์แบบจ าลองและการแก้ไขแบบจ าลองจะมีความส าคัญก็ตาม (Spiegelhalter, 1998)

การแจกแจงความน่าจะเป็นแบบมีเงื่อนไข: กราฟ DAG ที่ถูกสร้างขึ้นจะต้องรวมการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขส าหรับทุก ๆ โหนดในกราฟ (Lucas et al, 2004) โดยถ้าตัวแปรเป็นแบบแยกส่วน สามารถแสดงเป็นตาราง (การแจกแจงหลายสาย) ซึ่งจะแสดงความน่าจะเป็นที่โหนดย่อย ใช้ในแต่ละค่าที่แตกต่างกันส าหรับการรวมกันของค่าจากโหนดพ่อแม่แต่ละชุด หากไม่มีการแจกแจงความน่าจะแบบมีเงื่อนไขวิธีการทางสถิติอ่ืน ๆ อาจใช้เพ่ือรับเงื่อนไขการแจกแจงนี้จากข้อมูล (เช่นการประมาณความถี่เชิงปริมาณของความน่าจะเป็นแบบมีเงื่อนไข) วิธีการค านวณที่เป็นไปได้จะระบุไว้ (Spiegelhalter, 1998) หรือ (Lucas et al, 2004) เมื่อถึงจุดนี้ข่ายงานเบย์จะถูกระบุค่าอย่างครบถ้วน อย่างไรก็ตามจ าเป็นต้องท าการวิเคราะห์ความไว ก่อนที่เครือข่ายสามารถใช้งานได้จริง (Lucas et al, 2004) การวิเคราะห์ความไว (sensitivity analysis) อาจด าเนินการได้เช่นเดียวกับการวิเคราะห์ความไว (deterministic sensitivity) แบบทางเดียว หรือการวิเคราะห์ความน่าจะเป็นของความไว

2. การเรียนรู้อัตโนมัติ (Automatic learning)

การเรียนรู้อัตโนมัติแตกต่างจากการสร้างด้วยมือ คือ การเรียนรู้โดยอัตโนมัติไม่จ าเป็นต้องมีความรู้จากผู้เชี่ยวชาญด้านโดเมน ข่ายงานเบย์อาจเรียนรู้ได้โดยอัตโนมัติจากฐานข้อมูล โดยใช้อัลกอริทึมที่ใช้ประสบการณ์ ซึ่งมักจะสร้างขึ้นในซอฟต์แวร์ที่เหมาะสม อย่างไรก็ตามความไม่สะดวกก็คือการก่อสร้างโดยอัตโนมัติท าให้ข้อก าหนดเกี่ยวกับข้อมูลมีความต้องการมากขึ้น ในอัลกอริทึมการเรียนรู้อัตโนมัติส่วนใหญ่ หาก

Page 6: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

6

มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้ ต้องมีการน าเข้ามาหรือใช้การประมาณจากแหล่งอ่ืน (Lucas et al, 2004) นอกจากนี ้ต้องมีข้อมูลเพียงพอที่จะตอบสนองความต้องการของอัลกอริธึม ส าหรับการประมาณค่าการแจกแจงความน่าจะเป็นแบบมีเงื่อนไข ส าหรับการก่อสร้างด้วยตนเอง การแจกแจงความน่าจะเป็นแบบมีเงื่อนไขถือว่าเป็นที่รู้จักก่อน การเรียนรู้โดยอัตโนมัตินั้นเกี่ยวข้องกับการสร้างโครงสร้างเครือข่ายและการประมาณค่าการแจกแจงความน่าจะเป็นแบบมเีงื่อนไข (Lucas etal, 2004)

5. ตัวอย่างข่ายงานเบยแ์ละการค านวณ

ตัวอย่างที่ 1

ภาพที่ 2 แสดงข่ายงานแบบเบย์ของเงื่อนไขการเกิดโรคไขมันในเส้นเลือด

จากภาพที่ 2 แสดงข่ายงานเบย์ของเงื่อนไขการเกิดโรคไขมันในเส้นเลือด ที่มีความสัมพันธ์กัน ซึ่งได้แก่ กินอาหารขยะ (Eat Junk Food) ไม่ออกก าลังกาย (Do not Exercise) มีไขมัน (Have Fat) อ้วน (Fat) และเป็นโรคไขมันในเส้นเลือด (Fatty in veins)

และแสดงตารางความน่าจะเป็นแบบมีเงื่อนไข (Conditional Probability Table: CPT) ต่อไปนี้

กินอาหารขยะ

ไม่ออกก าลงักาย

มีไขมนั อว้น

โรคไขมนัในเส้นเลือด

HF

J NE

F

FV

P(J) = 0.5 P(NE) = 0.4

Page 7: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

7

ตารางท่ี 1: CPT ของมีไขมัน (Have Fat) ตารางท่ี 2: CPT ของอ้วน (Fat)

J NE P(HF) T T 0.99

T F 0.89 F T 0.40

F F 0.15

ตารางท่ี 3: CPT ของโรคไขมันในเส้นเลือด (Fatty in veins)

F HF P(FV) T T 0.95

T F 0.18

F T 0.80 F F 0.00

จากภาพที ่2 และ CPT แสดงความน่าจะเป็นของการเกิดโรคไขมันในเส้นเลือด จงหาความน่าจะเป็นที่จะเป็นโรคไขมันในเส้นเลือดกับคนที่รูปร่างไม่อ้วน แต่มีไขมันสะสมในร่างกายมาก จากการกินอาหารขยะและไม่อออกก าลังกาย

วิธีท า

จากโจทย์สามารถค านวณได้จากสมการ ต่อไปนี้

P(NE, J, HF, , FV) = P(NE) · P(J|NE) · P(HF|J, NE) · P( |HF, J, NE) · P(FV| , HF, J,NE)

P(NE, J, HF, , FV) = P(NE) · P(J) · P(HF|J, NE) · P( |J, NE) · P(FV| , HF)

= 0.4 · 0.5 · 0.99 · (1-0.68) · 0.80

= 0.0506

ดังนั้น ความน่าจะเป็นที่จะเป็นโรคไขมันในเส้นเลือดกับคนที่รูปร่างไม่อ้วน แต่มีไขมันสะสมในร่างกายจากการกินอาหารขยะและไม่อออกก าลังกาย เท่ากับ 0.0506 หรือคิดเป็นร้อยละ 5.06

J NE P(F)

T T 0.68 T F 0.56

F T 0.40 F F 0.00

Page 8: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

8

ตัวอย่างที่ 2

ภาพที่ 3 แสดงข่ายงานแบบเบย์ของเงื่อนไขการเรียนไม่จบ

จากภาพที่ 3 แสดงข่ายงานเบย์ของเงื่อนไขการเรียนไม่จบ ที่มีความสัมพันธ์กัน ซึ่งได้แก่ อ่านหนังสือใกล้วันสอบ (Read the book near the exam date) นอนดึก (Sleep late) สอบไม่ผ่าน (Failing the exam) โดดเรียนบ่อย (Skip class) เกรดตก (Failing grade) โดนรีไทร์ (Retire) และแสดงตารางความน่าจะเป็นแบบมีเงื่อนไข (CPT) ต่อไปนี้

ตารางท่ี 4: CPT สอบไม่ผ่าน (Failing the exam) ตารางท่ี 5: CPT โดดเรียนบ่อย (Skip class)

B C P(F) T T 0.80

T F 0.65 F T 0.25

F F 0.08

S P(C)

T 0.70

F 0.50

อ่านหนงัสือใกลว้นัสอบ

นอนดึก

สอบไม่ผา่น โดดเรียนบ่อย

เกรดตก

โดนรีไทร์

B

F

S

C

G

R

P(B) = 0.80 P(S) = 0.60

Page 9: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

9

ตารางท่ี 6: CPT เกรดตก (Failing grade) ตารางที่ 7: CPT โดนรีไทร์ (Retire)

C F P(G) T T 0.95

T F 0.30 F T 0.95

F F 0.10

ตารางท่ี 8: CPT สอบไม่ผ่าน (Failing the exam) จากเหตุการณ์การอ่านหนังสือใกล้วันสอบ

จากภาพที่ 3 และ CPT แสดงความน่าจะเป็นของเงื่อนไขการโดนรีไทร์ จงหาความน่าจะเป็นที่นักศึกษาจะไม่โดนรีไทร์ โดยที่เกรดตกเนื่องจากสอบไม่ผ่านเพราะอ่านหนังสือใกล้วันสอบ และเข้าเรียนประจ าเพราะไม่เคยนอนดึก

วิธีท า

จากโจทยส์ามารถค านวณได้จากสมการ ต่อไปนี้

P(B, , F, , G, ) = P(B) · P( |B) · P(F| , B) · P( |F, , B) ·

P(G| , F, , B) · P( |G, , F, , B)

P(B, , F, , G, ) = P(B) · P( ) · P(F|B) · P( | ) · P(G| , F) · P( |G)

= 0.80 · (1-0.60) · 0.65 · (1-0.50) · 0.95 · (1-0.70)

= 0.0296

ดังนั้น ความน่าจะเป็นที่นักศึกษาจะไม่โดนรีไทร์ โดยที่เกรดตกเนื่องจากสอบไม่ผ่านเพราะอ่านหนังสือใกล้วันสอบ และเข้าเรียนประจ าเพราะไม่เคยนอนดึก เท่ากับ 0.0296 หรือคิดเป็นร้อยละ 2.96

G P(R)

T 0.70

F 0.00

B P(F)

T 0.65

F 0.25

Page 10: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

10

6. การประยุกต์ใช้ข่ายงานเบย์ในงานวิจัย

ทฤษฎีของข่ายงานเบย์ได้ถูกน ามาประยุกต์ใช้ในงานวิจัยในหลาย ๆ ด้าน โดยกลุ่มผู้ศึกษาได้สนใจและยกมากล่าวถึง ดังต่อไปนี้

1. การพยากรณ์ประสิทธิภาพบอกซ์ออฟฟิศโดยใช้เครือข่ายความเชื่อเบย์: กรณีศึกษาภาพยนตร์ไทย ในงานวิจัยนี้มีวัตถุประสงค์เพ่ือพยากรณ์ประสิทธิภาพของบอกซ์ออฟฟิศของภาพยนตร์ไทย โดยใช้

ตัวแบบข่ายความเชื่อเบย์ (Bayesian Belief Networks: BBN) มาพยากรณ์ความส าเร็จของบอกซ์ออฟฟิศ และเพ่ือหาสาเหตุของความเกี่ยวข้องกันระหว่างภาพลักษณ์ในด้านความหลากหลายของภาพยนตร์ และความส าเร็จของผลงานการแสดง และในการค านวณบอกออฟฟิศที่ประสบความส าเร็จนั้นจะใช้ Bayesian belief networks Modal โดยในงานวิจัยนี้มีการออกแบบสถาปัตยกรรมของระบบ เพ่ือสร้างแบบจ าลองการพยากรณ์ ซึ่งมี 3 ขั้นตอน คือ การเก็บรวบรวมข้อมูล การ training data และการ testing model เพ่ือเป็นการอธิบายถึงความสัมพันธ์ระหว่างตัวแปรในแบบจ าลองที่สร้างขึ้น โดยข้อมูลที่ใช้ในการพยากรณ์ครั้งนี้ เป็นข้อมูลภาพยนตร์ไทย ระหว่างปี 2548-2552 จ านวนทั้งสิ้น 217 เรื่อง จากการวิเคราะห์ท าให้ได้ข้อสรุปว่าภาพลักษณ์เหล่านั้น มีผลต่อยอดการจ าหน่ายตั๋ว ซึ่งเป็นรายได้ของภาพยนตร์ ซึ่งผลของประสิทธิภาพการพยากรณ์ให้ความถูกต้องถึง 94.4545 %

2. การเปรียบเทียบการพยากรณ์ระหว่างวิธีเครือข่ายเบย์เซียนและวิธีการปรับให้เรียบแบบเอ็กซ์ โพเนนเชียล ส าหรับดัชนีราคาหุ้นกลุ่มอสังหาริมทรัพย์และก่อสร้างในประเทศไทย

งานวิจัยนี้เป็นการศึกษาและเปรียบเทียบวิธีการพยากรณ์ดัชนีราคาหุ้นกลุ่มอสังหาริมทรัพย์และก่อสร้างในประเทศไทย โดยข้อมูลที่ใช้ในงานวิจัยเป็นอนุกรมเวลารายเดือนตั้งแต่เดือนมกราคม 2552 ถึง เดือนธันวาคม 2556 เพ่ือหาช่วงการพยากรณ์ล่วงหน้าที่เหมาะสมที่สุด ซึ่งจากการวิเคราะห์เบื้องต้นพบว่าอนุกรม เวลาของดัชนีราคาหุ้นกลุ่มอสังหาริมทรัพย์และก่อสร้างมีลักษณะการเคลื่อนไหวของแนวโน้มเส้นตรงและไม่มีอิทธิพลของฤดูกาล ซึ่งวิธีการพยากรณ์ที่ใช้ในงานวิจัยนี้จะเปรียบเทียบระหว่างวิธีข่ายงานเบย์และวิธีการปรับ ให้เรียบแบบเอ็กซ์โปเนนเชียลของโฮลต์ โดยวิธีการพยากรณ์ที่เหมาะสมจะพิจารณาจากค่าความคลาดเคลื่อนก าลังสองเฉลี่ย (MSE) และเปอร์เซ็นต์ความคลาดเคลื่อนสัมบูรณ์เฉลี่ย (MAPE) ที่ต่ าที่สุด ผลการศึกษาพบว่าวิธีการ พยากรณ์ที่ให้รูปแบบที่เหมาะสมที่สุด คือ วิธีการปรับให้ เรียบแบบเอ็กซ์โปเนนเชียลของโฮลต์ จากรูปแบบดังกล่าว น ามาค านวณช่วงการพยากรณ์ล่วงหน้า 1-6 เดือน พบว่าการพยากรณ์ระยะสั้นล่วงหน้า 1-3 เดือน เหมาะสมส าหรับ วิธีการพยากรณ์วิธีนี้

3. ปัจจัยที่มีผลต่อผลสัมฤทธิ์ทางการศึกษาของนักเรียนระดับมัธยมศึกษาโดยใช้ข่ายงานเบย์ กรณศีึกษา: โรงเรียนปอพานพิทยาคมรัชมังคลาภิเษก

ในวิจัยนี้ผู้วิจัยได้สร้างแบบจ าลองโดยใช้ข่ายงานเบย์ ในการก าหนดโครงสร้างความสัมพันธ์ ของข้อมูลตัวแปรที่เป็น Packet Header ในระบบเครือข่ายคอมพิวเตอร์ เพ่ือที่จะท าให้การตรวจจับและวิเคราะห์ข้อมูลว่าเป็นข้อมูลที่ปกติหรือผิดปกติ มีความน่าจะเป็นที่จะเป็นการบุกรุกเข้ามาในระบบเครือข่ายคอมพิวเตอร์ได้

Page 11: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

11

ซึ่ง การศึกษานี้มีวัตถุประสงค์เพ่ือ ศึกษาปัจจัยและความสัมพันธ์ระหว่างปัจจัยที่มีผลต่อผลสัมฤทธิ์ทางการศึกษาของนักเรียนระดับมัธยมศึกษา โดยใช้ตัวแบบข่ายงานเบย์ (Bayesian Networks) ข้อมูลที่ใช้ในการทดลอง เป็นข้อมูลนักเรียนระดับชั้นมัธยมศึกษาปีที่ 1-6 โรงเรียนปอพานพิทยาคมรัชมังคลาภิเษก ปีการศึกษา 2551 ผลการทดลองที่ได้แสดงในรูปค่าความน่าจะเป็นของปัจจัยที่ส่งผลต่อผลสัมฤทธิ์ทางการศึกษาของนักเรียน ที่สามารถน าไปวินิจฉัยเชิงเหตุและผล ช่วยให้ครูประจ าชั้นและ ผู้มีส่วนเกี่ยวข้องใช้เป็นข้อมูลในการหาแนวทางป้องกันปัญหา ลดความรุนแรงของปัญหา รวมทั้งส่งเสริมให้นักเรียนได้พัฒนาเต็มตามศักยภาพของแต่ละบุคคลได้ จากการทดลองพบว่าปัจจัยที่มีผลต่อผลสัมฤทธิ์ทางการศึกษาของนักเรียนอยู่ในระดับสูง และความสัมพันธ์ระหว่างปัจจัยพบว่า ปัจจัยด้านระดับการศึกษาของผู้ปกครอง รายได้ของครอบครัว ระยะทางจากบ้านมาโรงเรียน และอาชีพของครอบครัวมีความสัมพันธ์กับแรงจูงใจใฝ่สัมฤทธิ์ทางการเรียนการคบเพ่ือนและเจตคติต่อการเรียน

7. บทสรุป

ข่ายงานเบย์ (BNs) เป็นแบบจ าลองกราฟิกประเภทหนึ่งที่อาศัยความน่าจะเป็น ซึ่งโครงสร้างแบบกราฟิกเหล่านี้ ใช้อธิบายความไม่ขึ้นต่อกันอย่างมีเงื่อนไข (Condition Independent) ระหว่างตัวแปร โดยที่แต่ละโหนดในกราฟจะแทนด้วยตัวแปรสุ่ม และเส้นเชื่อมระหว่างโหนดจะแสดงถึงความขึ้นแก่กันของตัวแปรสุ่ม วิธีการเรียนรู้ของข่ายงานนี้จะเกิดขึ้นโดยการใช้ความรู้ก่อนหน้า (Prior Knowledge) และตัวอย่างสอนเพ่ือให้การเรียนรู้มีประสิทธิภาพ นอกจากนี้คุณสมบัติของแบบจ าลองข่ายงานเบย์ยังประกอบด้วยองค์ประกอบหลัก 2 องค์ประกอบ คือ กราฟอวัฏจักรระบุทิศทาง (DAG) และเซตของพารามิเตอร์ของข่ายงาน ซึ่งในการสร้างข่ายงานเบย์นั้น จะสามารถท าได้ภายใต้เงื่อนไขของข่ายงานเบย์ดังที่กล่าวไว้ข้างต้น รวมไปถึงวิธีการค านวณความน่าจะเป็นจากแบบจ าลองกราฟิก ในบทความนี้ได้ยกตัวอย่างสถานการณ์พร้อมแสดงการค านวณเบื้องต้นไว้ ซ่ึงจะพบว่าปัจจัยหลักในการอนุมานค่าของข่ายงานเบย์ คือ แบบจ าลองกราฟิก และตารางความน่าจะเป็นแบบมีเงื่อนไข (CPT)

ในปัจจุบัน พบว่าข่ายงานเบย์ (BNs) ได้กลายเป็นรูปแบบที่นิยมอย่างมากในการแก้ไขปัญหา และสามารถน าไปประยุกต์ใช้ในงานด้านต่าง ๆ การได้ทราบถึงหลักทฤษฎี เงื่อนไขหรือข้อจ ากัดในการสร้างข่ายงานเบย์ จึงนับเป็นหัวใจส าคัญในการแก้ไขปัญหาใหม่ ๆ ที่อาจจะประสบในชีวิตของการเรียนรู้ในภายภาคหน้าได้ต่อไป

Page 12: การศึกษาข่ายงานเบย์และการประยุกต์sc2.kku.ac.th/stat/statweb/images/Eventpic/60/... · 6 มีข้อมูลขาดหายไปในชุดข้อมูลเหล่านี้

12

บรรณานุกรม

บุษบา สืบสิงห์. (2552). ปัจจัยท่ีมีผลต่อผลสัมฤทธิ์ทางการศึกษาของนักเรียนระดับมัธยมศึกษาโดยใช้

ข่ายงานเบย์ กรณีศึกษา: โรงเรียนปอพานพิทยาคม รัชมังคลาภิเษก. วิทยานิพนธ์ปริญญา

วิทยาศาสตรมหาบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์,

มหาวิทยาลัยขอนแก่น

ภาภรณ์ เหล่าพิสัย. (2554). การพยากรณ์ประสิทธิภาพบอกซ์ออฟฟิศโดยใช้เครือข่ายความเชื่อเบย์:

กรณีศึกษาภาพยนตร์ไทย. การศึกษาอิสระปริญญาวิทยาศาสตรมหาบัณฑิต สาขาวิชา

เทคโนโลยีสารสนเทศ คณะวิทยาศาสตร์, มหาวิทยาลัยขอนแก่น

เมธินี กวินภาส, ประสิทธิ์ พยัคฆพงษ์ และบุญอ้อม โฉมท. (2558). การเปรียบเทียบการพยากรณ์ระหว่าง

วิธีเครือข่ายเบย์เซียนและวิธีการปรับให้เรียบแบบเอ็กซ์โปเนนเชียลส าหรับดัชนีราคาหุ้นกลุ่ม

อสังหาริมทรัพย์และก่อสร้างในประเทศไทย: วารสารวิทยาศาสตร์และเทคโนโลยี. 23(2),

203-211

สมพล สุนัยรัตนาภรณ์. (2551). การเรียนรู้โครงสร้างเบย์เซียนเน็ตเวิร์คด้วย Genetic Algorithm โดย

ใช้โครโมโซมรูปแบบ Directed Acyclic Graph. วิทยานิพนธ์ปริญญาวิทยาศาสตร

มหาบัณฑิต สาขาวิทยาการคอมพิวเตอร์ คณะสถิติประยุกต์, สถาบันบัณฑิตพัฒนบริหาร

ศาสตร์

F. van Harmelen, V. Lifschitz and B. Porter. (2008). Bayesian Networks: Handbook of

Knowledge Representation. Paper no. 467-498

Michal Horný. (2014). Bayesian Networks. 2014(5), Paper no. 1-17

Wiley & Sons (2007). Bayesian Networks: Encyclopedia of Statistics in Quality &

Reliability. (2007) Paper no. 1-6