สถิติ หมายถึง ศาสตร์ที่นำมากระทำกับหลักฐานที่เป็นข้อมูลซึ่งอาจจะเป็นข้อมูลเชิงปริมาณหรือเชิงคุณภาพ โดยมีวิธีการกระทำได้แก่ การเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์โดยใช้หลักการทางคณิตศาสตร์ และการนำผลการวิเคราะห์มาสรุป ประเภทของสถิติศาสตร์ 1. สถิติพรรณนา (Descriptive statistics) เป็นสถิติที่ใช้ในการสรุปข้อมูลที่ได้มาจากกลุ่มตัวอย่าง
โดยไม่มีการอ้างอิงไปยังประชากร แต่เป็นการบรรยายลักษณะข้อมูลเท่านั้น เช่น การแจกแจงความถี่ (frequency distribution) การวัดแนวโน้มเข้าสู้ส่วนกลาง การวัดการกระจายของข้อมูล ฯลฯ การนำเสนอผลการวิเคราะห์ข้อมูลพรรณนาจะอยู่ในรูปตาราง (table) และแผนภูมิ (Chart) ชนิดต่างๆ 2. สถิติอ้างอิง (Inferential statistics) หรือสถิติอนุมาน
เป็นสถิติที่ใช้เพื่อนำผลสรุปที่คำนวณได้จากการสุ่มตัวอย่าง ไปอธิบายหรือสรุปลักษณะของประชากรทั้งหมด วิธีที่ใช้ในการสรุปอ้างอิงไปยังกลุ่มประชากรนั้น คือ การประมาณค่า (Estimation) และการทดสอบสมมติฐาน (Hypothesis testing) การวิเคราะห์ความแปรปรวน (analysis of variance) การวิเคราะห์ความถดถอยและสหสัมพันธ์ (regression and correlation analysis) สถิติอ้างอิงจำแนกเป็น 2 ชนิดคือ แบบอ้างอิงพารามิเตอร์ (Parametric statistics) (ทดสอบสมมุติฐานโดยใช้สถิติ t-test, z-test, ANOVA, regression analysis ตัวแปรที่ต้องการวัดเป็น interval scale กลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ กลุ่มประชากรจะต้องมีความแปรปรวนเท่ากัน) และแบบไม่อ้างอิงพารามิเตอร์ (Nonparametric statistics) (ใช้สถิติ chi-square, medium test, sign test กลุ่มตัวอย่างเป็น free distribution เป็นกลุ่มตัวอย่างขนาดเล็ก ไม่ทราบลักษณะการแจกแจงของประชากรที่สนใจจะศึกษา) พารามิเตอร์ หมายถึง ค่าที่ใช้อธิบายคุณลักษณะประชากร (population) เช่น ค่าเฉลี่ยของประชากร (population mean) ค่าสถิติ หมายถึง ค่าที่ได้จากตัวอย่าง (sample) เช่น
ค่าเฉลี่ยของตัวอย่าง (sample mean) ลักษณะข้อมูลที่ใช้ในงานวิจัย - ข้อมูลเชิงปริมาณ แบ่งเป็นข้อมูลต่อเนื่อง (continuous data) คือค่าที่มีจุดทศนิยมได้ และข้อมูลไม่ต่อเนื่อง (discrete data) คือค่าที่เป็นจำนวนเต็มหรือจำนวนนับ - ข้อมูลเชิงคุณภาพ เป็นข้อมูลที่แสดงถึงสถานภาพ คุณลักษณะ หรือคุณสมบัติ เช่น เพศ ตำแหน่ง หรือจำแนกตัวแปรตามระดับการวัด ได้แก่ - นามบัญญัติ (nominal scale) จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม เช่น 1=ชาย 2=หญิง ตัวเลขไม่สามารถนำมาบวก ลบ คูณ หาร ได้ - เรียงอันดับ (ordinal scale) ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด เช่น ระดับการศึกษา ผลการเรียน ความเก่ง ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้ เช่น ไม่สามารถบอกได้ว่าเก่งกว่ากันเท่าไหร่ ตัวเลขสามารถนำมาบวกหรือลบกันได้ - อันตรภาค หรือระดับช่วง (interval scale) กำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่าๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะไม่มีศูนย์ที่แท้จริง เช่น คะแนนสอบ อุณหภูมิ (อุณหภูมิ 0 องศา มิได้หมายความว่าจะไม่มีความร้อน) ตัวเลขสามารถนำมาบวก ลบ คูณ หรือหารกันได้ - อัตราส่วน (ratio scale) สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มีศูนย์แท้ เช่น น้ำหนัก ความสูง อายุ สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ (เช่น ถนน 50 กิโลเมตร ยาวเป็น 2 เท่าของถนน 25 กิโลเมตร) หรือจำแนกตามหน้าที่ ได้แก่ ตัวแปรอิสระ (ตัวแปรต้น) และตัวแปรตาม ซึ่งเป็นตัวแปรที่ต้องการศึกษา นอกจากนั้นอาจมีตัวแปรที่ไม่ได้ต้องการศึกษาแต่ต้องควบคุม เช่น ตัวแปรภายนอก (ตัวแปรเกิน หรือตัวแปรแทรกซ้อน) และตัวแปรเชื่อมโยง (ตัวแปรสอดแทรก) สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงปริมาณ - การแจกแจงข้อมูล ความถี่ (Frequency distribution) ร้อยละ (percentage) - วัดแนวโน้มเข้าสู่ส่วนกลาง ได้แก่ ค่าเฉลี่ย (mean) นำข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจำนวนข้อมูล / มัธยฐาน (median) เป็นสถิติในการจัดอันดับข้อมูล เป็นค่าที่อยู่ตรงกลาง เมื่อนำค่าที่ได้จากการวัดที่นำมาเรียงลำดับจากมากไปน้อย หรือน้อยไปมาก / ฐานนิยม (mode) หรือคะแนนที่มีความถี่สูงที่สุด - บอกตำแหน่งของข้อมูล ได้แก่ เปอร์เซ็นต์ไทล์ (percentile) เดไซล์ (decide) ควอไทล์ (quartile) - วัดการกระจายของข้อมูล ได้แก่ พิสัย (range) หรือค่าสูงสุด-ค่าต่ำสุด ส่วนเบี่ยงเบนควอไทล์ (quartile deviation) ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ความแปรปรวนของข้อมูล (variance) สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงคุณภาพ ได้แก่ ร้อยละ (percentage) สัดส่วน (proportion) อัตราส่วน (ratio) ฐานนิยม (mode) สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณ - สัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน (Pearson’s Correlation Coefficient) - สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน (Spearman’s correlation coefficient) สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงคุณภาพ - สัมประสิทธิ์สหสัมพันธ์ของเครเมอร์วี (Cramer’s V) - สร้างตารางไขว้แสดงความสัมพันธ์ระหว่างตัวแปร (crosstabulation table) |