Download - บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

Transcript
Page 1: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

บทคัดย่อ การเลอืกใช้สถติทิีถ่กูต้องและเหมาะสมสามารถลดความผดิพลาดทีอ่าจเกดิขึน้จากกระบวนการวเิคราะห์ข้อมลูบทความนี้มุ่งเน้นการเลือกใช้สถิติในการวิเคราะห์ข้อมูลส�าหรับการวิจัยทางวิทยาศาสตร์สุขภาพโดยเฉพาะบุคลากรทางการแพทย์และสาธารณสุขส�าหรับการเลือกใช้สถิติที่เหมาะส�าหรับการวิจัยทางวิทยาศาสตร์สุขภาพมีองค์ประกอบในการพิจารณาที่ส�าคัญคือ1)ข้อมูลตัวแปรและระดับการวัดของข้อมูล2)การทดสอบทางสถิติ3)ค�าถามวิจัยและ4) ประเภทของสถิติ ซึ่งแต่ละองค์ประกอบมีความส�าคัญและเชื่อมโยงสู่การเลือกใช้สถิติในการวิเคราะห์ข้อมูลทางวทิยาศาสตร์สขุภาพอย่างถกูต้องและเหมาะสมนอกจากนี้สถติใินการวเิคราะห์ข้อมลูจ�าแนกออกเป็นสถติพิาราเมตรกิและสถิตินอนพาราเมตริกซึ่งสถิติทั้งสองประเภทมีข้อตกลงเบื้องต้นในการวิเคราะห์ที่แตกต่างกันดังนั้นการวางแผนที่ดีส�าหรับการเลือกใช้สถิติที่เหมาะสมในการวิเคราะห์ข้อมูลส่งผลต่อการน�าเสนอข้อมูลที่ถูกต้องและเหมาะสมต่อไป

ค�าส�าคัญ : สถิติการวิเคราะห์ข้อมูลการวิจัยทางวิทยาศาสตร์สุขภาพ

Abstract Choosinganaccurateandappropriatestatisticsindataanalysisaretodecreasebiasduringtheprocessofanalysis.Thepurposeofthisarticle istoemphasizeonchoosingstatistics indataanalysisforhealthscienceresearch.Inparticular,itisbenefitformedicalandhealthpersonnel.Thecomponentofchoosinganappropriatestatistics inhealthscienceresearchcomprisesof1)data,variablesandscaleofmeasurement2)statisticstesting3)researchquestionand4)typeofstatistics.Thosecomponentsarelinkedtochoosinganappropriateandaccrualstatisticsinhealthscience.Inaddition,statisticaltesting isdividedintotwomajortypesuchas;parametricandnon-parametricstatisticswhichhavedifferentassumptions.Hence,well-plannedandorganizedintousinganappro-priatestatisticsisresultingtoappropriatedatapresentation.

Keywords:Statistics,DataAnalysis,HealthScienceResearch

การเลือกใช้สถิติในการวิเคราะห์ข้อมูลส�าหรับการวิจัยทางวิทยาศาสตร์สุขภาพChoosing Statistics in Data Analysis for Health Science Research

ปุญญพัฒน์ไชยเมล1์*

BhunyabhadhChaimay1*

1ผศ.ดร.,สาขาวิชาสาธารณสุขศาสตร์คณะวิทยาการสุขภาพและการกีฬามหาวิทยาลัยทักษิณพัทลุง93110*Corresponding:โทรศัพท์/โทรสาร074-693-997อีเมล์[email protected]

บทความวิชาการ

Page 2: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

69การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯ

ปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

บทน�า ปัจจุบันการวิจัยทางวิทยาศาสตร์สุขภาพมีความก้าวหน้าและพัฒนาไปอย่างมากโดยเฉพาะการน�าองค์ความรู้จากการวิจัยมาประยุกต์ใช้ในการดูแลสุขภาพและพัฒนาคุณภาพชีวิตนอกจากนี้องค์กรทางสุขภาพต่างมีนโยบายส่งเสรมิให้มกีารใช้ความรูจ้ากกงานวจิยัในการพฒันาระบบงานในทกุระดบัดงันัน้การท�าวจิยัให้ส�าเรจ็ผูว้จิยัต้องด�าเนนิการวิจัยตามกระบวนการอย่างถูกต้อง[1]อย่างไรก็ตามการเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลดความผิดพลาดที่อาจเกิดขึ้นจากการวิเคราะห์ข้อมูลและส่งผลให้งานวิจัยมีความน่าเชื่อถือมากยิ่งขึ้น “สถิติ”เป็นศาสตร์ที่ใช้ในการค้นหาข้อเท็จจริง[2]และมีความหมายหลายลักษณะ[3]ได้แก่1)ตัวเลขหรือข้อมูลสถิติ2)ศาสตร์ที่เกี่ยวกับวิธีการศึกษาข้อมูลหรือระเบียบวิธีทางสถิติ [1]และ3)วิชาสถิตินอกจากนี้สถิติเป็นเครื่องมือการวิจัยทางวิทยาศาสตร์ [4] มีขั้นตอนที่ส�าคัญในการวิจัย การทดสอบทางสถิติเป็นการแปลงข้อมูลดิบสู่ผลการศึกษาที่มีความหมายและสามารถประยุกต์ใช้ต่อไป อย่างไรก็ตาม การเลือกใช้สถิติได้อย่างถูกต้องและเหมาะสมส่งผลต่อการวเิคราะห์ข้อมลูความแม่นย�าและความน่าเชือ่ถอืจากการทบทวนวรรณกรรมงานวจิยัทางวทิยาศาสตร์สขุภาพพบว่าประมาณ2ใน3มีข้อพกพร่องในการเลือกใช้สถิติทั้งสถิติเชิงพรรณนาและสถิติเชิงอนุมาน[5]และจากงานวิจัยที่เผยแพร่ตีพิมพ์ในวารสารทางวิทยาศาสตร์สุขภาพพบว่า มีการน�าเสนอผลการวิเคราะห์ข้อมูลด้วยสถิติพรรณนาเพียงอย่างเดียว(47%)และสถิติเชิงอนุมาน(31%)และสถิติพหุตัวแปร(22%)และสถิติขั้นสูง(19%)[6] อย่างไรก็ตาม การวิเคราะห์ด้วยสถิติที่ไม่เหมาะสม [4] ส่งผลต่อการวิเคราะห์ การแปลผลที่ผิดพลาดและเป็นการลดคุณค่างานวิจัยนอกจากนี้การเลือกใช้สถิติยังเป็นสิ่งส�าคัญในการพิจารณาสนับสนุนทุนวิจัย[7]การตัดสินใจเชงินโยบายในกรณทีีต้่องใช้ข้อมลูหรอืผลการศกึษาจากงานวจิยั(Evidence-based)ดงันัน้การเลอืกใช้สถติทิีเ่หมาะสมผู้วิจัยควรเริ่มจากวางแผนตั้งแต่โครงร่างวิจัย โดยเฉพาะอย่างยิ่งขั้นตอนการวิเคราะห์ข้อมูลส�าหรับบทความนี้มุ่งเน้นการเลอืกใช้สถติใินการวเิคราะห์ข้อมลูทางวทิยาศาสตร์สขุภาพโดยเฉพาะบคุลากรทางการแพทย์และสาธารณสขุเพือ่ใช้ประโยชน์ในการเลือกใช้สถิติในการวิเคราะห์ข้อมูลส�าหรับวิทยาศาสตร์สุขภาพต่อไป

ข้อควรพิจารณาการเลือกใช้สถิติ ส�าหรับการพิจารณาการเลือกใช้สถิติส�าหรับการวิเคราะห์ข้อมูลทางวิทยาศาสตร์สุขภาพ[4,8-11]ควรค�านึงถงึประเดน็ส�าคญัดงันี้1)ตวัแปรข้อมลูระดบัการวดัของข้อมลู2)การทดสอบทางสถติิ3)ค�าถามวจิยัหรอืวตัถปุระสงค์และ4)ประเภทของสถิติโดยมีรายละเอียดดังนี้

ข้อมูลและตัวแปร และระดับของตัวข้อมูล ข้อมูลคือข้อเท็จจริงที่ได้จากการวัดหรือสังเกตอาจอยู่ในรูปของตัวเลขหรือข้อความ[3,12]ข้อมูลการวิจัยจ�าแนกเป็นข้อมลูเชงิคณุภาพ(Qualitativedata)และข้อมลูเชงิปรมิาณ(Quantitativedata)ซึง่ข้อมลูดงักล่าวมคีวามสัมพันธ์กับระดับการวัดของข้อมูล[13]ส�าหรับตัวแปร(Variables)มีคุณลักษณะหรือคุณสมบัติที่สามารถเปลี่ยนแปลงค่าได้[3,15]ทั่วไปแบ่งออกเป็น1)ตัวแปรต้นหรือตัวแปรอิสระ(Independentvariables)คือตัวแปรเหตุหรือก่อให้เกิดการแปรผันของปรากฏการณ์ และ 2) ตัวแปรตาม (Dependent variables) คือ ตัวแปรที่เป็นผลมาจากการเปลี่ยนแปลงค่าของตัวแปรต้นหรือตัวแปรอิสระและเป็นตัวแปรที่ผู้วิจัยมุ่งวัดหรือผลลัพธ์(Outcomes) ในส่วนของระดับการวัดของข้อมูล (Scale ofmeasurement) [3, 15-18] จ�าแนกเป็นระดับนามบัญญัติ(Nominalscale)ระดับเรียงล�าดับ (Ordinal scale)ระดับอันตรภาค (Interval scales)และระดับสัดส่วน (Ratioscale)หรอืจ�าแนกออกเป็น2ประเภท[1,14]คอืข้อมลูแจงนบั(Category)และข้อมลูต่อเนือ่ง(Continuous)ส�าหรบัข้อมูลข้อมูลแจงนับ [4] คือ ข้อมูลในระดับนามบัญญัติและระดับเรียงล�าดับ ส่วนข้อมูลต่อเนื่อง คือ ข้อมูลในระดับอันตรภาคและระดับสัดส่วน

Page 3: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

70การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

การทดสอบทางสถิติ การทดสอบทางสถติเิป็นการสรปุหาค�าตอบจากกลุม่ตวัอย่างสูก่ลุม่ประชากร[19]มขีัน้ตอนทีส่�าคญั[10,14]ดังนี้1)การก�าหนดค�าถามวิจัยหรือวัตถุประสงค์2)การก�าหนดสมมติฐาน3)การพิจารณาเลือกสถิติที่เหมาะสม4)การก�าหนดระดับนัยส�าคัญทางสถิติ5)การทดสอบทางสถิติและการพิจารณาผลการวิเคราะห์และ6)การแปลผลในส่วนการทดสอบทางสถิติจ�าแนกเป็นการประมาณค่าและการทดสอบสมมติฐาน การประมาณค่า(Estimation)เป็นวธิกีารทดสอบทางสถติเิพือ่อธบิายลกัษณะของประชากร[4,14]หรอือ้างองิข้อมูลจากกลุ่มตัวอย่างสู่กลุ่มประชากร[12,13,20]ค่าที่ได้จากการประมาณค่าในกลุ่มประชากรคือค่าพารามิเตอร์(Parameters:P)[21,22]และค่าที่ได้จากการประมาณค่าในกลุ่มตัวอย่างคือค่าสถิติ(Statistics:X,SD,p)[1,13,21,22]การประมาณค่าจ�าแนกออกเป็น2ประเภทคือการประมาณค่าแบบจุด(Pointestimation)และการประมาณค่าแบบช่วง (Intervalestimation)ส�าหรับการประมาณค่าแบบจุดเป็นการประมาณค่าเพียงค่าเดียวซึ่งผลจากการประมาณค่ามโีอกาสเท่ากบัค่าจรงิได้น้อยและเกดิโอกาสความคลาดเคลือ่นได้มากส�าหรบัการประมาณค่าแบบช่วงเป็นการก�าหนดช่วงความกว้างของค่าพารามิเตอร์ที่แสดงถึงค่าพารามิเตอร์ที่มีอยู่จริงในกลุ่มประชากร[14]นอกจากนี้การประมาณค่าแบบช่วงยงัเป็นตวับ่งชีค้วามแม่นย�าของการศกึษาส�าหรบัการค�านวณช่วงเชือ่มัน่(Confidentinterval)[13]มักก�าหนดช่วงเชื่อมั่นที่ร้อยละ95(95percentconfidentinterval:95%CI)[14]โดยที่ร้อยละ95ครั้งของการศึกษาจะปรากฏค่าเฉลี่ยของประชากรในช่วงดังกล่าว การวิจัยเป็นการค้นหาองค์ความรู้อย่างเป็นระบบ[12]เพื่ออ้างอิงผลการศึกษาสู่กลุ่มประชากร[14,23]วิธีการดังกล่าวเรียกว่า“การทดสอบสมมติฐาน(Hypothesistesting)”[3]หรือ“การทดสอบนัยส�าคัญ(Testofsignificance)”[13]โดยการตัง้ค�าถามเพือ่คาดคะเนค�าตอบ[22]ในลกัษณะข้อความทีค่าดคะเนความสมัพนัธ์ระหว่างตวัแปรต้นและตวัแปรตามตามค�าถามหรอืวตัถปุระสงค์การวจิยั[13]การสมมตฐิานจ�าแนกออกเป็นสมมตฐิานการวจิยัและสมมติฐานทางสถิติ ส�าหรบัสมมตฐิานการวจิยั(Researchhypothesis)เป็นข้อความทีเ่ขยีนขึน้เพือ่เป็นการพยากรณ์ค�าตอบจากการวิจัยโดยน�าเหตุผลประสบการณ์องค์ความรู้หรือผลจากการวิจัยที่ผ่านมาประกอบการพิจารณาการและการเขียนสมมติฐานการวิจัยเป็นการแสดงลักษณะของความสัมพันธ์ของตัวแปรตั้งแต่สองตัวขึ้นไป ในขณะที่สมมติฐานทางสถิติ(Statistical hypothesis) อยู่ในรูปของโครงสร้างทางคณิตศาสตร์และใช้สัญลักษณ์แทนข้อความหรือตัวแปรเพื่อใช้ในการทดสอบทางสถติจิ�าแนกเป็นสมมตฐิานว่าง(Nullhypothesis:H0)และสมมตฐิานทางเลอืก(Alternativehypothesis:H1)สมมติฐานว่างเป็นสมมติฐานมีลักษณะเป็นกลางและใช้สัญลักษณ์ค่าพารามิเตอร์ของประชากรแทนเช่นค่าเฉลี่ยของประชากร()และความแปรปรวนของประชากร(2)และในลักษณะ“ไม่มีความสัมพันธ์”หรือ“ไม่มีความแตกต่าง”[4]ในขณะทีส่มมตฐิานทางเลอืกเป็นสมมตฐิานตรงข้ามกบัสมมตฐิานว่างและเขยีนในลกัษณะ“ความแตกต่าง”หรือ“ความสัมพันธ์ การสรปุผลจากสมมตฐิานโดยเปรยีบเทยีบกบัระดบันยัส�าคญัทางสถติิ(Alpha:)ที่0.01หรอื0.05อย่างไรก็ตาม การทดสอบสมมติฐานอาจมีความคลาดเคลื่อนเกิดขึ้นได้ เช่น ความคลาดเคลื่อนชนิดที่ 1 (Type 1 error)ความคลาดเคลื่อนที่เกิดขึ้นเมื่อปฏิเสธสมมติฐานว่างในขณะที่สมมติฐานว่างถูกต้อง และความคลาดเคลื่อนชนิดที่ 2(Type2error)ความคลาดเคลื่อนที่เกิดขึ้นเมื่อไม่ปฏิเสธสมมติฐานว่างในขณะที่สมมติฐานว่างกล่าวผิด

ความสัมพันธ์ระหว่างค�าถามวิจัยและการเลือกใช้สถิติในการวิเคราะห์ข้อมูล ค�าถามหรอืวตัถปุระสงค์การวจิยัเป็นสิง่ส�าคญัในการด�าเนนิการวจิยั[8]และเป็นสิง่ก�าหนดทศิทางในการท�างานเพือ่เชือ่มโยงสูก่ารพจิารณาการเลอืกใช้สถติทิีเ่หมาะสมในการวเิคราะห์ข้อมลู[15,16]ค�าถามหรอืวตัถปุระสงค์การวจิยั

Page 4: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

71การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯ

ปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

จ�าแนกเป็น1)วัตถุประสงค์เพื่อการพรรณนา เป็นวัตถุประสงค์ที่ต้องการพรรณนาลักษณะธรรมชาติของการเกิดโรคเช่น ความชุก อุบัติการณ์การเกิดโรคเป็นต้น 2) วัตถุประสงค์เพื่อการเปรียบเทียบ ศึกษาความสัมพันธ์ หรือเพื่อการท�านายและ3)วัตถุประสงค์เพื่อการศึกษาความสัมพันธ์เชิงเหตุและผลซึ่งเป็นการศึกษาความสัมพันธ์เชิงเหตุและผลระหว่างตวัแปรต้นและตวัแปรตามจากความสมัพนัธ์ในวตัถปุระสงค์ข้อที่1ควรเลอืกใช้สถติเิชงิพรรณนา(Descriptivestatistics)และวัตถุประสงค์ข้อที่2และ3ควรเลือกใช้สถิติเชิงอนุมาน(Inferentialstatistics)ในการวิเคราะห์ข้อมูลเป็นต้น

ประเภทของสถิติส�าหรับการวิเคราะห์ข้อมูล สถิติส�าหรับการวิเคราะห์ข้อมูลจ�าแนกเป็น[1]1)สถิติเชิงพรรณนาและ2)สถิติเชิงอนุมานสถิติเชิงพรรณนา[15]เป็นสถิติที่ใช้ส�าหรับการอธิบายคุณลักษณะของข้อมูล[24]เป็นสถิติที่ง่ายที่สุดในการวิเคราะห์และน�าเสนอข้อมูลการแปลผลไม่ซับซ้อนสถิติเชิงพรรณนาจ�าแนกออกเป็น2ประเภทคือการวัดแนวโน้มเข้าสู่ส่วนกลาง(Measureofcentraltendency)และการวัดการกระจาย(Measureofdispersionหรือvariability) การวดัแนวโน้มเข้าสูส่่วนกลางเป็นการวดัทางสถติเิบือ้งต้น[21]และควรค�านงึถงึ[17]1)การเป็นตวัแทนของข้อมลูและ2)การกระจายของข้อมลูค่าสถติทิีใ่ช้ในการวดัแนวโน้มเข้าสูส่่วนกลางคอืค่าเฉลีย่(Mean)มธัยฐาน(Mean)และฐานนิยม (Mode) โดยที่ค่าเฉลี่ย คือ ค่ากลาง [14] หรือค่าที่ได้จากการน�าข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจ�านวนข้อมูลทั้งหมดส�าหรับค่ามัธยฐานคือค่ากลางของชุดข้อมูลจากการเรียงล�าดับ[14]ในขณะที่ฐานนิยมคือค่าความถี่ของข้อมูลที่ซ�้ากันมากที่สุด การวดัแนวโน้มเข้าสูส่่วนกลางมคีวามสมัพนัธ์กบัการกระจายของข้อมลู[21]ซึง่ข้อมลูทีม่ค่ีาสงูหรอืต�่ามากเกนิกว่าปกติ(Outliers)มีโอกาสท�าให้การวัดมีคลาดเคลื่อน[14]โดยที่ลักษณะการแจกแจงที่ดีต้องมี1)การกระจายแบบโค้งปกติ (Normaldistribution)ซึ่งค่าที่ได้จากการวัด [1,4]ระหว่างค่าเฉลี่ยมัธยฐานและฐานนิยมจะมีค่าเท่ากันหรือลักษณะของการกระจายแบบที่สมมาตร(Normaldistribution,Gaussiandistributionหรือbell-shaped)2)ในกรณีที่ข้อมูลมีการกระจายแบบเบ้[1,25]จ�าแนกออกเป็น2ชนิดคือเบ้ขวา(Positivelyskeweddistributionหรือright-skewed)และเบ้ซ้าย(Negativelyskeweddistributionหรือleft-skewed)ค่าที่ได้จากการวัดแนวโน้มเข้าสู่ส่วนกลางจะมีความแตกต่างกันในกรณีการวิเคราะห์ข้อมูลส�าหรับข้อมูลระดับนามบัญญัติ และเรียงอันดับการน�าเสนอด้วยร้อยละ เหมาะสมที่สุด เนื่องจากข้อมูลประเภทดังกล่าวไม่มีคุณสมบัติในเชิงค�านวณ ส�าหรับข้อมูลระดับอันตรภาคและระดับสัดส่วนควรน�าเสนอด้วยค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน[15,18] ส�าหรบัการวดัการกระจายเป็นการวดักระจายของข้อมลูดบิจากค่าเฉลีย่ในกรณทีีข้่อมลูมคีวามแปรปรวนมากหมายถึงข้อมูลมีการกระจายมาก[1,17]การวัดการกระจายพิจารณาได้จากค่าสถิติดังนี้1)ส่วนเบี่ยงเบนมาตรฐาน(Standarddeviation:SD)คือการวัดการกระจายหรือความแปรปรวนของชุดข้อมูลในกลุ่มตัวอย่าง(Datavariabil-ity)หรือความแปรแปรวนยกก�าลังสอง2)สัมประสิทธิ์ความแปรปรวน(Coefficientofvariation:CV)คือการวัดการกระจายของแต่ละตัวแปรเทียบกับค่าเฉลี่ย โดยที่ค่าสัมประสิทธิ์ความแปรปรวนมีค่าใกล้“0”หมายถึงมีการกระจายน้อยซึ่งส่วนใหญ่ใช้ในการเปรียบเทียบความแตกต่างระหว่างชุดข้อมูลและ3)ค่าInterquartilerange(IQR):คือค่าความแตกต่างของข้อมูลด้วยระยะห่างในล�าดับที่3และล�าดับที่1 [17]ซึ่งแสดงเป็นลักษณะของพิสัยที่ร้อยละ50การน�าเสนอด้วยค่า Interquartile range เหมาะส�าหรับข้อมูลที่มีการกระจายแบบอิสระหรือมีชุดข้อมูลที่มีค่าสูงหรือต�่ามากเกินกว่าปกติ[25] สถิติเชิงอนุมานเป็นสถิติที่ใช้ส�าหรับการประมาณค่าและทดสอบสมมติฐาน[21]เพื่อเป็นการยืนยันองค์ความรู้หรือค้นพบโดยการขจัดข้อโต้แย้ง[15]]และน�าข้อค้นพบไปอธิบายหรือสรุปผลสู่กลุ่มประชากรที่ท�าการศึกษา

Page 5: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

72การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

ท�าการศึกษา(InferenceหรือGeneralization)[1,26]โดยอาศัยหลักของความน่าจะเป็นในการทดสอบ[3,14]สถิติเชิงอนุมานจ�าแนกเป็นสถิติพาราเมตริก(Parametricstatistics)และสถิตินอนพาราเมตริก(Non-parametricstatis-tics) โดยที่สถิติพาราเมตริกมีอ�านาจการทดสอบ (Power of test) สูงกว่าสถิตินอนพาราเมตริก [14] ซึ่งสถิติทั้ง 2ประเภทมข้ีอตกลงเบือ้งต้นในการน�าไปใช้ทีแ่ตกต่างกนั[26]กล่าวคอืการทดสอบด้วยสถติพิาราเมตรกิข้อมลูต้องมรีะดบัการวัดของข้อมูลในระดับอันตรภาคหรืออัตราส่วนและมีการกระจายแบบโค้งปกติ(Normaldistribution)เท่านั้น[4,14] ส�าหรับสถิตินอนพาราเมตริกนั้น ข้อมูลอยู่ในระดับอันตรภาคหรืออัตราส่วนซึ่งมีรูปแบบการกระจายของข้อมูลไม่จ�ากัดรูปแบบหรือมีระดับการวัดของข้อมูลในระดับนามบัญญัติหรือเรียงอันดับเท่านั้น นอกจากนี้ข้อตกลงเบื้องต้นในการเลือกใช้สถิตินอนพาราเมตริกในการวิเคราะห์ข้อมูลมีดังนี้1)กลุ่มตัวอย่างมีจ�านวนน้อย2)ข้อมูลมีระดับการวัดแบบแจงนับ3)ไม่ทราบรูปแบบการกระจายของข้อมูล4)ชุดข้อมูลมีค่าที่สูงหรือต�่าผิดปกติ(Outliers)และ5)ความแปรปรวนระหว่างกลุ่มของกลุ่มตัวอย่างไม่เท่ากัน

การเลือกสถิติส�าหรับการวิเคราะห์ข้อมูลทางวิทยาศาสตร์สุขภาพ การทดสอบทางสถิติจ�าแนกตามจ�านวนชุดของข้อมูลคือข้อมูล1กลุ่มและข้อมูล≥2กลุ่มนอกจากนี้การทดสอบยังสามารถจ�าแนกออกเป็น [26]การทดสอบความแตกต่าง (Testofdifference)การทดสอบความสัมพันธ์(Testofrelationship)และสถติขิัน้สงู(Advancedstatistics)ส�าหรบับทความนี้มุง่เน้นการเลอืกสถติโิดยการจ�าแนกจ�านวนชุดของข้อมูลตัวแปรตามดังแสดงในภาพที่1 การทดสอบทางสถิติส�าหรับข้อมูล1กลุ่มแบ่งตามลักษณะของข้อมูลออกเป็นตัวแปรที่มีระดับการวัดแบบแจงนับทดสอบด้วยสถิติPearsonChi-squaretestและFisherexacttestในกรณีที่ตัวแปรมีระดับการวัดแบบต่อเนื่อง ซึ่งก่อนท�าวิเคราะห์ข้อมูลหรือทดสอบทางสถิติควรมีการทดสอบการกระจายของข้อมูลทุกครั้งว่ามีการกระจายเป็นแบบโค้งปกติหรือไม่ด้วยสถิติKolmogorov-Smirnovgoodness-of-fit-test[4]เพื่อใช้ในการตัดสินใจส�าหรับชุดข้อมูลที่มีการกระจายแบบโค้งปกติท�าการทดสอบด้วยสถิติOnesample t-testและสถิติWilcoxonsigned-ranktestส�าหรับข้อมูลที่ไม่มีการกระจายแบบโค้งปกติ ส�าหรับการวิเคราะห์ข้อมูล2กลุ่มการเลือกสถิติในการวิเคราะห์ข้อมูลพิจารณาจากระดับการวัดของตัวแปรตามและความเป็นอสิระของข้อมลูในกรณทีีต่วัแปรตามมรีะดบัการวดัแบบแจงนบัและมคีวามเป็นอสิระต่อกนัสถติทิีใ่ช้Pearsonchi-squaretestและFisherexacttestนอกจากนี้ในกรณีที่ข้อมูล2ชุดไม่มีอิสระต่อกันสถิติที่ควรใช้คือMcNemartest อย่างไรก็ตามส�าหรับการวิเคราะห์ข้อมูลด้วยสถิติPearsonchi-squaretestและFisher’sexacttestมีข้อตกลงเบื้องต้นในการทดสอบที่แตกต่างกัน[27]กล่าวคือการเลือกใช้สถิติPearsonchi-squaretestควรมีจ�านวนของขนาดกลุ่มตัวอย่าง(Observedvalue)ในแต่ละCellส�าหรับตาราง2X2หรือMXNไม่น้อยกว่า5และควรมีค่าความคาดหวัง (Expected value) ไม่น้อยกว่าร้อยละ 20 ในกรณีที่ไม่เป็นไปตามข้อตกลงดังกล่าวข้างต้นควรยุบตารางให้เหลือตาราง2X2และสถิติที่เหมาะสมในการวิเคราะห์คือสถิติFisherexacttest ส�าหรับตัวแปรตามที่มีระดับการวัดประเภทต่อเนื่อง (Continuous data) เบื้องต้นควรทดสอบการกระจายของข้อมูลทุกครั้งว่ามีการกระจายแบบโค้งปกติหรือไม่ [14] ในกรณีที่มีการกระจายแบบโค้งปกติสามารถทดสอบด้วยสถิติพาราเมตริกคือIndependentt-testส�าหรับข้อมูลที่มีความอิสระต่อกันและสถิติPairedt-testส�าหรับข้อมูลไม่อิสระต่อกัน นอกจากนี้ ข้อมูลที่ไม่มีการกระจายแบบโค้งปกติสถิตินอนพาราเมตริกที่ใช้ในการวิเคราะห์ คือ สถิติMann-WhiteyUtestส�าหรับข้อมูลที่อิสระต่อกันและสถิติWilcoxonsigned-ranktestส�าหรับข้อมูลที่ไม่อิสระต่อกัน

Page 6: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

73การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯ

ปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

ในกรณีข้อมูลจ�านวน ≥2 กลุ่ม การพิจารณาเลือกสถิติส�าหรับตัวแปรที่มีระดับการวัดแจงนับมีลักษณะเช่นเดียวกันกับที่กล่าวในข้างต้นโดยพิจารณาจากระดับการวัดของข้อมูลและความเป็นอิสระต่อกัน[14]ส�าหรับข้อมูลมีความอิสระต่อกันสถิติที่ใช้คือPearsonchi-squaretestและข้อมูลที่ไม่อิสระต่อกันคือCochranQtestในกรณีประเภทข้อมูลต่อเนื่องและข้อมูลมีการกระจายแบบโค้งปกติและไม่อิสระต่อกันสถิติที่ใช้ในการวิเคราะห์คือสถิติ Re-peatedANOVAส่วนสถิติOne-wayANOVAใช้ในกรณีกลุ่มตัวอย่างมีความอิสระต่อกันนอกจากนี้ ในกรณีที่ข้อมูลไม่มีการกระจายแบบโค้งปกติและข้อมูลมีความอิสระต่อกันควรใช้สถิติ Friedman test และข้อมูลที่ไม่อิสระต่อกันใช้สถิติKruskal-Wallistestในการทดสอบ นอกจากนี้การเลือกใช้สถิติในการทดสอบความสัมพันธ์และการท�านายซึ่งสถิติดังกล่าวมีข้อควรพิจารณาในเลือกใช้สถิติเช่นเดียวกับการเลือกใช้สถิติในกรณีข้อมูล1กลุ่มและ≥2กลุ่ม[14]โดยพิจารณาจากประเภทระดับการวัดของตัวแปรตาม และตัวแปรต้น ในกรณีการเลือกใช้สถิติในการทดสอบความสัมพันธ์และการท�านายส�าหรับตัวแปรตามที่มีระดับการวัดประเภทแจงนับ [14] ส่วนตัวแปรต้นสามารถเป็นได้ทั้งตัวแปรแจงนับและตัวแปรต่อเนื่อง คือSimple logistic regressionanalysis ในกรณีที่ตัวแปรตามเป็นประเภทต่อเนื่อง เมื่อพิจาณาตัวแปรต้นเป็นชนิดต่อเนื่องและ/หรือแจงนับสถิติที่ใช้คือSimplelinearregressionanalysis นอกจากนี้ การพิจารณาการเลือกใช้สถิติในการทดสอบความสัมพันธ์และการท�านายด้วยวิธีการทดสอบพหุตวัแปร(Multivariateanalysis)[23,28-29]ซึง่วตัถปุระสงค์ของการทดสอบดงักล่าวเพือ่เป็นการทดสอบความสมัพนัธ์หรือเพื่อการท�านายด้วยสมการถดถอย(Regressionmodeling)ระหว่างตัวแปรต้น (Xs)และตัวแปรตาม(Y) โดยมีการควบคมุตวัแปรกวน(ConfoundingfactorsหรอืMulticolinearity)ในกรณมีรีะดบัการวดัของตวัแปรตามประเภทต่อเนื่องควรใช้สถิติ Multiple regression analysis ส�าหรับการทดสอบด้วยสถิติ Multiple logistic regressionanalysisเป็นการทดสอบทีเ่หมาะกบัตวัแปรตามทีม่รีะดบัการวดัประเภทแจงนบัและเป็นชนดิ2ตวัแปร(Dichotomousหรือbinaryoutcome)เท่านั้น

บทสรุป การเลอืกใช้สถติทิีเ่หมาะส�าหรบัการวจิยัทางวทิยาศาสตร์สขุภาพมอีงค์ประกอบในการพจิารณาหลายประการคือ11)ข้อมูลตัวแปรและระดับการวัดของข้อมูล2)การทดสอบทางสถิติ3)ค�าถามวิจัยและ4)ประเภทของสถิติซึ่งแต่ละองค์ประกอบมีความส�าคัญและเชื่อมโยงสู่การเลือกใช้สถิติในการวิเคราะห์ข้อมูลทางวิทยาศาสตร์สุขภาพอย่างถูกต้องและเหมาะสม การด�าเนินงานวิจัยผู้วิจัยควรพิจารณาและวางแผนในการเก็บข้อมูลอย่างละเอียด และท�าความเข้าใจถึงวตัถปุระสงค์การวจิยัซึง่เป็นประเดน็ส�าคญัทีค่วรพจิารณาว่ามวีตัถปุระสงค์เพือ่การใดเช่นวตัถปุระสงค์เพือ่การพรรณนาเปรยีบเทยีบทดสอบความสมัพนัธ์หรอืเพือ่การท�านายนอกจากนี้สถติใินการวเิคราะห์ข้อมลูจ�าแนกออกเป็น2ประเภทคอืสถติพิาราเมตรกิและสถตินิอนพาราเมตรกิซึง่สถติทิัง้สองประเภทมคีวามแตกต่างกนัโดยทีส่ถติพิาราเมตรกิเป็นการทดสอบโดยใช้ข้อมูลที่มีการกระจายแบบโค้งปกติและสถิติเป็นการทดสอบโดยใช้ข้อมูลที่ไม่มีการกระจายแบบโค้งปกติซึ่งแต่ละประเภทมีการเลือกใช้โดยขึ้นอยู่กับระดับการวัดของตัวแปรตามและข้อตกลงเบื้องต้นของสถิติแต่ละประเภท ดังนั้นผู้วิจัยควรมีการวางแผนในการเลือกใช้สถิติที่เหมาะสมในการวิเคราะห์ข้อมูลเพื่อเป็นประโยชน์ในการวิเคราะห์และน�าเสนอข้อมูลที่ถูกต้องและเหมาะสมต่อไป

Page 7: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

74การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

เอกสารอ้างอิง[1]Perez-VicenteS,ExpositoRuitzM.(2009).Descriptivestatistics.Allergol Immunopathol (Madr). 2009;37(6):314-320.[2]เชิดศักดิ์โฆวาสินธุ์.(2531).สถิติวิเคราะห์ส�าหรับการวิจัย.วารสารการวัดผลการศึกษา.10(29):7-19.[3]นิภาเมธธาวีชัย.(2543).สถิติส�าหรับการวิจัย.วารสารเผยแพร่ความรู้ทางวิชาการและงานวิจัย.9:123-150.[4]SongJW,HaasA,ChungKC.(2009).Applicationofstatisticaltestsinhandsurgery.J Hand Surg. 34:1872–1881.[5]CruessDF.(1989).ReviewofuseofstatisticsinTHEAMERICANJOURNALOFTROPICALMEDICINE ANDHYGIENEFORJANUARY-DECEMBER1988.Am. J. Trop. Med.Hyg.41(6):619-529.[6]GoldinJ,ZhuW,SayreJW.(1996).Areviewofthestatisticalanalysisusedinpaperspublishedin ClinicalRadiologyandBritishJournalofRadiology.Clinical Radiology.51:47-50.[7]อรณุจริวฒัน์กลุ.(2549).การเขยีนวธิวีเิคราะห์ทางสถติใินโครงร่างวจิยั.วารสารวชิาการสาธารณสขุ.15(5):661-662.[8]Jaykaran.(2010).Howtoselectappropriatestatisticaltest?J Pharm Negat Results.2010;1(2):61–63.[9]NamCM,ChungSY.(2012).Statisticalmethodsformedicalstudies.J Korean Med Assoc.55(6): 573–581.[10]duPrelJB,RöhrigB,HommelG,BlettnerM.(2010).Choosingstatisticaltests:part12ofaserieson evaluationofscientificpublications.Dtsch Arztebl Int.107(19):343-348.[11]SoyemiK.(2012).Researchandstatistics:Choosingtherightstatisticaltest. Pediatrics in Review. 33(5):e38-e44.[12]บุญมีพันธุ์ไทย.(2553).การใช้วิธีการทางสถิติในการท�าวิจัย. วารสารรามค�าแหง.27(4):37-52.[13]สมรัตน์เลิศมหาฤทธิ์.(2543).สถิติในการวิจัย.ใน:ภิรมย์กมลรัตนกุล,มนต์ชัยชาลาประวรรตน์, ทวีสินตันประยูร.หลักการท�าวิจัยให้ส�าเร็จ.(พิมพ์ครั้งที่2).กรุงเทพฯ:บริษัทเท็กซ์แอนด์เจอร์นัล พับลิเคชั่นจ�ากัด.[14]OverholserBR,SowinskiKM.(2007).BiostatisticsPrimer:PartI.Nutr Clin Pract.22(6):629-635.[15]อนันต์เกิดด�า.(2552).แนวทางการเลือกใช้สถิติในการวิจัย.คอมพิวเตอร์และเทคโนโลยีขั้นสูง.10:8-14.[16]บุญเรืองศรีเหรัญ.(2542).การเลือกใช้สถิติในการวิจัย.วารสารเพชรบุรีวิทยาลงกรณ์.:28-39.[17]FisherMJ,MarshallAP.(2009).Understandingdescriptivestatistics. Australian Critical Care. 22:93-97.[18]ThompsonCB.(2009).Descriptivedataanalysis.Air Medical Journal.28(2):56-59.[19]อรณุจริวฒัน์กลุ.(2548).การเลอืกตวัอย่างและการอนมุานด้วยสถติ.ิวารสารวชิาการสาธารณสขุ.14(5):739-740.[20]อรุณจิรวัฒน์กุล,มาลินีเหล่าไพบูลย์,จิราพรเขียวอยู่,ยุพาถาวรพิทักษ์,จารุวรรณโชคคณาพิทักษ์, บัณฑิตถิ่นค�ารพและคณะ.(2550).ชีวสถิติ.(พิมพ์ครั้งที่4).ขอนแก่น:โรงพิมพ์คลังนานาวิทยา.[21]สมเกียรติจงประสิทธิ์พร.(2537).การน�าเสนอข้อมูลด้วยสถิติ.วารสารวิชาการพระจอมเกล้าพระนครเหนือ. 4(1):10-25.[22]WissingDR,TimmD.(2012).Statisticsforthenonstatistician:PartI.Southern Medical Association. 105(3):126-130.

Page 8: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

75การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯ

ปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

[23]KocherMS,ZurakowskiD.(2004).Clinicalepidemiologyandbiostatistics:Aprimerfororthopaedicsurgeons.J Bone Joint Surg Am.86:607-620.[24]มณีรัตน์ธีระวิวัฒน์.(2543).เทคนิคการเลือกสถิติวิเคราะห์ข้อมูลในงานวิจัยพฤติกรรมสุขภาพ. วารสารเพื่อนสุขภาพ.12(1):54-57.[25]O’BrienPC.ShampoMA.RobertsonJS.(1983).Statisticsfornuclearmedicine:introduction, descriptivestatisticsandgraphicdisplays.The Journal of Nuclear Medicine.24(1):83-88.[26]วรรณชนกจนัทชมุ.(2541).การใช้สถติวิเิคราะห์ข้อมลูในการวจิยัทางการพยาบาล.วารสารคณะพยาบาลศาสตร์. 21(4):1-8.[27]ปุญญพัฒน์ไชยเมล์.(2553).ข้อควรระวังในการใช้Chi-squareTestในงานวิจัยทางด้านวิทยาศาสตร์สุขภาพ. วารสารมหาวิทยาลัยทักษิณ.13(1):55-58[28]LeeperJD.TheUniversityofCaliforniaatLos-angles.What statistical analysis should I use? Retrieved11November2012fromhttp://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm.

Page 9: บทความวิชาการ - zrolsoft.comzrolsoft.com/lpnhresearch/images/newsflash/2Choosing.pdf · บทคัดย่อ การเลือกใช้สถิติที่ถูกต้องและเหมาะสมสามารถลด

76การเลือกใช้สถิติในการวิเคราะห์ข้อมูลฯปุญญพัฒน์ไชยเมล์

Thaksin.J.,Vol.17(1)January-June2014

วารสารมหาวิทยาลัยทักษิณปีที่17ฉบัับที่1มกราคม-มิถุนายน2557

ภาพที่ 1การพิจารณาการเลือกใช้สถิติในการวิเคราะห์ข้อมูลทางวิทยาศาสตร์สุขภาพ


Top Related