Data Innovation and Governance Institute, DIGI
246 ยอดรับชม
วิทยาศาสตร์ เทคโนโลยีดิจิทัล และนวัตกรรม
สรุปให้! “แจกแจงความถี่ข้อมูล” คืออะไร มีประเภทไหน
30 Nov 2022
กระบวนการพื้นฐานทางสถิตินั้นมีบทบาทสำคัญมากในทุกวันนี้ การใช้งานทางสถิติมีตั้งแต่กระบวนการพื้นฐานที่ใช้ในชีวิตประจำวันเช่น การนับเลข จัดหมวดหมู่ของข้อมูลต่าง ๆ ที่รับได้รับมา จนถึงการทำวิจัยในการศึกษาซึ่งมีข้อมูลจำนวนมากมาย กระบววนการทางสถิติจึงเป็นเครื่องมือที่เข้ามาช่วยจัดการข้อมูลเหล่านั้นให้มีความเป็นระบบ ระเบียบมากยิ่งขึ้นจนทำให้ง่ายต่อการทำความเข้าใจ
หนึ่งในกระบวนการทางสถิติที่นิยมใช้มากนั่นคือ “การแจกแจงความถี่ข้อมูล” ซึ่งกระบวนการแจกแจงข้อมูลจะเริ่มเข้ามามีบทบาทหลังจากที่กำหนดตัวแปรที่ต้องการศึกษา และมีการเก็บรวบรวมข้อมูลเกี่ยวกับตัวแปรที่ต้องการศึกษาแล้ว ข้อมูลที่เก็บได้เรียกว่า ข้อมูลดิบ (Raw Data) ซึ่งข้อมูลดิบต้องได้รับการจัดระเบียบและให้ง่ายต่อการทำความเข้าใจและนำไปใช้งานต่อในการวิเคราะห์ข้อมูลในขั้นตอนถัดไป ทำให้กระบวนการแจกแจงข้อมูลมีความสำคัญมากนั่นเอง
ดังนั้นวันนี้ DIGI จะพาทุกคนไปทำความรู้จักกับ การแจกแจงข้อมูลว่าคืออะไร รวมไปถึงประเภทของการแจกแจงข้อมูลว่ามีกี่ประเภทรวมไปถึงส่วนประกอบของตารางแจกแจงความถี่ข้อมูล และวิธีการแจกแจงข้อมูลว่ามีกระบวนการทำอย่างไร
ความหมายของ “การแจกแจงความถี่ข้อมูล”
ก่อนจะไปถึงการแจกแจงข้อมูล อยากให้ทำความรู้จักความถี่ หรือ Frequency ก่อนโดย ความถี่ของค่าใดค่าหนึ่งคือจำนวนครั้งที่ค่านั้นเกิดขึ้นในข้อมูล การกระจายของตัวแปรคือรูปแบบของความถี่ ซึ่งเมื่อนำเอากระบวนการแจกแจงเข้ามารวมกับความถี่ความหมายก็คือกระบวนการที่แยกค่าที่เกิดขึ้นของข้อมูลให้เกิดความเป็นระบบระเบียบตามที่เรากำหนด
โดยการแจกแจงความถี่สามารถแสดงเป็นจำนวนจริงของการสังเกตในแต่ละช่วงซึ่งจะออกมาเป็นตัวเลขหรือสรุปออกมาเป็นเปอร์เซ็นต์ของการสังเกตก็ได้โดยในกรณีหลังนี้เรียกว่าการแจกแจงความถี่สัมพัทธ์ และตารางแจกแจงความถี่สามารถใช้ได้ทั้งตัวแปรที่เป็นตัวเลขหรือข้อมูลที่ไม่ใช่ตัวเลขก็ได้
ประเภทของตารางแจกแจงความถี่ข้อมูล
ประเภทของตารางแจกแจงความถี่ข้อมูลสามารถแบ่งออกได้เป็น 4 ประเภทได้แก่
1.ตารางแจกแจงความถี่ที่ไม่ได้จัดกลุ่ม (Ungrouped frequency distribution)
จะเป็นการแจกแจงความถี่โดยประเภทของการแจกแจงจะเป็นข้อมูลประเภทเดี่ยวโดยจะไม่ได้เป็นกลุ่มหรือเป็นช่วง ตัวอย่างเช่น การแจกแจงข้อมูลเพศ ซึ่งก็คือจะแยกออกมาได้เป็นเพศชาย เพศหญิง และไม่ได้ระบุเพศ เป็นต้น
2.การแจกแจงความถี่แบบจัดกลุ่ม (Grouped frequency distribution)
จะเป็นการแจกแจงความถี่โดยประเภทของการแจกแจงจะเป็นข้อมูลเป็นกลุ่มหรือเป็นช่วงข้อมูล โดยการแจกแจงข้อมูลประเภทนี้มักจะเกิดกับข้อมูลเชิงปริมาณ ตัวอย่างเช่น ช่วงของอายุ ช่วงของน้ำหนัก หรือช่วงของความสูง
3.การแจกแจงความถี่สัมพัทธ์ (Relative frequency distribution)
จะเป็นการแจกแจงความถี่ของข้อมูลโดยข้อมูลความถี่แต่ละอันจะมีการเปรียบเทียบข้อมูลซึ่งกันและกันโดยความถี่ที่ออกมามักจะเป็นร้อยละหรือเปอร์เซ็น
4.การแจกแจงความถี่สะสม (Cummulative frequency distribution)
จะเป็นการแจกแจงความถี่ของข้อมูลโดยข้อมูลความถี่แต่ละอันจะมีการรวมข้อมูลจากชุดข้อมูลที่แสดงก่อนหน้าโดยประเภทของการแจกแจงสูงสุดจะเป็นการรวมจำนวนข้อมูลทั้งหมดเข้าด้วยกัน
ส่วนประกอบของตารางแจกแจงความถี่ข้อมูล
1.อันตรภาคชั้น (Class Interval)
ช่วงของข้อมูลที่แบ่งออกเป็นช่วงๆ ในแต่ละช่วงคือค่าที่เป็นไปได้ของข้อมูล โดยอันตรภาคชั้นจะเกิดขึ้นได้ก็ต่อเมื่อตารางแจกแจงความถี่นั้นเป็นประเภทการแจกแจงความถี่แบบจัดกลุ่ม โดยถ้าเป็นแบบไม่ได้จัดกลุ่มก็จะเป็นข้อมูลเดี่ยว ๆ ไม่ได้เป็นช่วง
2.ขอบบน ขอบล่าง (Upper – Lower Boundary)
ขอบบนของอันตรภาคชั้นใด หมายถึง ค่ากึ่งกลางระหว่างค่าที่เป็นไปได้สูงสุดของอันตรภาคชั้นนั้น กับค่าที่เป็นไปได้ต่ำสุดของอันตรภาคชั้นติดกันถัดไปเช่น อันตรภาคชั้น 21 – 30 และ 31 – 40 จะสามารถคำนวณขอบบนของอัรตรภาคชั้นของ 21 – 30 ได้โดยนำเอาค่าสูงสุดของอันตรภาคชั้น 21 – 30 คือค่า 30 มารวมกับค่าต่ำสุดของอันตรภาคชั้น 31 – 40 นั่นคือ 31 พอรวมค่าแล้วนำมาหาร 2 จะได้เท่ากับ 30.5 ซึ่งเป็นขอบบนของอันตรภาคชั้น 21 – 30 และยังเป็นขอบล่างของอันตรภาคชั้น 31 – 40 ด้วย
3.ความกว้างของอันตรภาคชั้น (Class Interval)
ผลต่างของขอบบนและขอบล่างของอันตรภาคชั้นนั้น นิยมเขียนแทนด้วย I เช่น อันตรภาคชั้น 21 – 30 มีความกว้างเท่ากับ 20.5 – 30.5 = 10 อันตรภาคชั้น 31 – 40 มีความกว้างเท่ากับ 30.5 – 40.5 = 10 เป็นต้น
4.จุดกึ่งกลาง (Mid point)
จุดกึ่งกลางของอันตรภาคชั้นใด คือ ค่าเฉลี่ยของช่วงคะแนนในอันตรภาคชั้นนั้นๆ จุดกึ่งกลางของอันตรภาคชั้นใด = (ขอบบน + ขอบล่าง) / 2 (ของอันตรภาคชั้นนั้นๆ)
5.ความถี่ (Frequency)
ความถี่ของอันตรภาคชั้นใดหมายถึงจำนวนข้อมูล (ค่าจากการสังเกต) ที่ปรากฏอยู่ในช่วงคะแนนหรืออันตรภาคชั้นนี้
สรุป
ตารางแจกแจงความถี่ข้อมูลนับเป็นอีกหนึ่งเครื่องมือที่มีความสำคัญและมีความง่ายต่อการเข้าใจในการสรุปข้อมูลที่มีความซับซ้อนให้กระชับ ผู้อ่านสามารถตีความได้ภายในระยะเวลาอันสั้นส่งผลให้เป็นอีกหนึ่งเครื่องมือที่หลายคนมักจะใช้ในการนำเสนอข้อมูล ดังนั้นการเรียนรู้ถึงการแจกแจงความถี่ข้อมูลจึงเป็นเรื่องสำคัญสำหรับมือใหม่ที่กำลังหัดเรียนรู้เรื่องของสถิติ
Like 0
คำไม่ถูกต้อง กรุณาลองใหม่อีกครั้ง
ความคิดเห็น (0)