การวิเคราะห์ข้อมูลใช้สถิติใด

สถิติ หมายถึง ศาสตร์ที่นำมากระทำกับหลักฐานที่เป็นข้อมูลซึ่งอาจจะเป็นข้อมูลเชิงปริมาณหรือเชิงคุณภาพ โดยมีวิธีการกระทำได้แก่ การเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์โดยใช้หลักการทางคณิตศาสตร์ และการนำผลการวิเคราะห์มาสรุป

ประเภทของสถิติศาสตร์

1. สถิติพรรณนา (Descriptive statistics) เป็นสถิติที่ใช้ในการสรุปข้อมูลที่ได้มาจากกลุ่มตัวอย่าง โดยไม่มีการอ้างอิงไปยังประชากร แต่เป็นการบรรยายลักษณะข้อมูลเท่านั้น เช่น การแจกแจงความถี่ (frequency distribution) การวัดแนวโน้มเข้าสู้ส่วนกลาง การวัดการกระจายของข้อมูล ฯลฯ การนำเสนอผลการวิเคราะห์ข้อมูลพรรณนาจะอยู่ในรูปตาราง (table) และแผนภูมิ (Chart) ชนิดต่างๆ

2. สถิติอ้างอิง (Inferential statistics) หรือสถิติอนุมาน เป็นสถิติที่ใช้เพื่อนำผลสรุปที่คำนวณได้จากการสุ่มตัวอย่าง ไปอธิบายหรือสรุปลักษณะของประชากรทั้งหมด วิธีที่ใช้ในการสรุปอ้างอิงไปยังกลุ่มประชากรนั้น คือ การประมาณค่า (Estimation) และการทดสอบสมมติฐาน (Hypothesis testing) การวิเคราะห์ความแปรปรวน (analysis of variance) การวิเคราะห์ความถดถอยและสหสัมพันธ์ (regression and correlation analysis) สถิติอ้างอิงจำแนกเป็น 2 ชนิดคือ แบบอ้างอิงพารามิเตอร์ (Parametric statistics) (ทดสอบสมมุติฐานโดยใช้สถิติ t-test, z-test, ANOVA, regression analysis ตัวแปรที่ต้องการวัดเป็น interval scale กลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ กลุ่มประชากรจะต้องมีความแปรปรวนเท่ากัน) และแบบไม่อ้างอิงพารามิเตอร์ (Nonparametric statistics) (ใช้สถิติ chi-square, medium test, sign test กลุ่มตัวอย่างเป็น free distribution เป็นกลุ่มตัวอย่างขนาดเล็ก ไม่ทราบลักษณะการแจกแจงของประชากรที่สนใจจะศึกษา)

พารามิเตอร์ หมายถึง ค่าที่ใช้อธิบายคุณลักษณะประชากร (population) เช่น ค่าเฉลี่ยของประชากร (population mean)

ค่าสถิติ หมายถึง ค่าที่ได้จากตัวอย่าง (sample) เช่น ค่าเฉลี่ยของตัวอย่าง (sample mean)

ลักษณะข้อมูลที่ใช้ในงานวิจัย

ข้อมูลเชิงปริมาณ แบ่งเป็นข้อมูลต่อเนื่อง (continuous data) คือค่าที่มีจุดทศนิยมได้ และข้อมูลไม่ต่อเนื่อง (discrete data) คือค่าที่เป็นจำนวนเต็มหรือจำนวนนับ

ข้อมูลเชิงคุณภาพ เป็นข้อมูลที่แสดงถึงสถานภาพ คุณลักษณะ หรือคุณสมบัติ เช่น เพศ ตำแหน่ง

หรือจำแนกตัวแปรตามระดับการวัด ได้แก่

นามบัญญัติ (nominal scale) จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม เช่น 1=ชาย 2=หญิง ตัวเลขไม่สามารถนำมาบวก ลบ คูณ หาร ได้

เรียงอันดับ (ordinal scale) ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด เช่น ระดับการศึกษา ผลการเรียน ความเก่ง ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้ เช่น ไม่สามารถบอกได้ว่าเก่งกว่ากันเท่าไหร่ ตัวเลขสามารถนำมาบวกหรือลบกันได้

อันตรภาค หรือระดับช่วง (interval scale) กำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่าๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะไม่มีศูนย์ที่แท้จริง เช่น คะแนนสอบ อุณหภูมิ (อุณหภูมิ 0 องศา มิได้หมายความว่าจะไม่มีความร้อน) ตัวเลขสามารถนำมาบวก ลบ คูณ หรือหารกันได้

อัตราส่วน (ratio scale) สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มีศูนย์แท้ เช่น น้ำหนัก ความสูง อายุ สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ (เช่น ถนน 50 กิโลเมตร ยาวเป็น 2 เท่าของถนน 25 กิโลเมตร)

หรือจำแนกตามหน้าที่ ได้แก่ ตัวแปรอิสระ (ตัวแปรต้น) และตัวแปรตาม ซึ่งเป็นตัวแปรที่ต้องการศึกษา นอกจากนั้นอาจมีตัวแปรที่ไม่ได้ต้องการศึกษาแต่ต้องควบคุม เช่น ตัวแปรภายนอก (ตัวแปรเกิน หรือตัวแปรแทรกซ้อน) และตัวแปรเชื่อมโยง (ตัวแปรสอดแทรก)

สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงปริมาณ

การแจกแจงข้อมูล ความถี่ (Frequency distribution) ร้อยละ (percentage)

วัดแนวโน้มเข้าสู่ส่วนกลาง ได้แก่ ค่าเฉลี่ย (mean) นำข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจำนวนข้อมูล / มัธยฐาน (median) เป็นสถิติในการจัดอันดับข้อมูล เป็นค่าที่อยู่ตรงกลาง เมื่อนำค่าที่ได้จากการวัดที่นำมาเรียงลำดับจากมากไปน้อย หรือน้อยไปมาก / ฐานนิยม (mode) หรือคะแนนที่มีความถี่สูงที่สุด

บอกตำแหน่งของข้อมูล ได้แก่ เปอร์เซ็นต์ไทล์ (percentile) เดไซล์ (decide) ควอไทล์ (quartile)

วัดการกระจายของข้อมูล ได้แก่ พิสัย (range) หรือค่าสูงสุด-ค่าต่ำสุด ส่วนเบี่ยงเบนควอไทล์ (quartile deviation) ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ความแปรปรวนของข้อมูล (variance)

สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงคุณภาพ

ได้แก่ ร้อยละ (percentage) สัดส่วน (proportion) อัตราส่วน (ratio) ฐานนิยม (mode)

สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณ

สัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน (Pearson’s Correlation Coefficient)

สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน (Spearman’s correlation coefficient)

สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงคุณภาพ

สัมประสิทธิ์สหสัมพันธ์ของเครเมอร์วี (Cramer’s V)

สร้างตารางไขว้แสดงความสัมพันธ์ระหว่างตัวแปร (crosstabulation table)