user name
Data Innovation and Governance Institute, DIGI.
2206 ยอดรับชม
Discrete vs Continuous Data

การศึกษา

"ข้อมูลเชิงปริมาณ": Discrete vs Continuous Data ต่างกันยังไง?

11 Jul 2022

ทำความรู้จักกับรายละเอียดที่เกี่ยวข้องทั้งหมดในส่วนของ Data ประเภท Quantitative Data ว่าข้อมูลเชิงปริมาณคืออะไร ข้อมูลเชิงปริมาณในแต่ละประเภทย่อยคืออะไร และวิธีการจำแนกข้อมูลเหล่านั้น รวมไปถึงตัวอย่างของข้อมูลในแต่ละประเภท

“ข้อมูลเชิงปริมาณ”: Discrete vs Continuous Data ต่างกันยังไง?

พื้นฐานของการเป็น ”นักวิทยาศาสตร์ข้อมูล” หรือ “Data Scientist” นั้นนอกจากจะต้องมีความรู้ในการเขียนโปรแกรมเพื่อใช้ในการนำข้อมูลมาวิเคราะห์แก้ปัญหาต่าง ๆ แล้วจำเป็นจะต้องมีความรู้ทางด้านสถิติร่วมด้วยเนื่องจากการจะจัดการข้อมูลจำนวนมหาศาลได้นั้นจำเป็นต้องใช้เทคนิคทางสถิติเพื่อเป็นตัวช่วยนักวิทยาศาสตร์ข้อมูลในการแปรผลข้อมูล ซึ่งความรู้พื้นฐานที่ทุกคนควรเริ่มเรียนรู้คือเริ่มจากการทำความรู้จักกับ “ข้อมูล” หรือ “Data” โดย Data สามารถแบ่งออกเป็น “ข้อมูลเชิงคุณภาพ” หรือ “Qualitative data” และ “ข้อมูลเชิงปริมาณ” หรือ “Quantitative Data” โดยข้อมูลเชิงปริมาณจะสามารถแยกออกได้เป็นอีก 2 ประเภทย่อยได้แก่ “Discrete Data” และ “Continuous Data

 

วันนี้ DIGI จะพาทุกคนไปทำความรู้จักกับรายละเอียดที่เกี่ยวข้องทั้งหมดในส่วนของ Data ประเภท Quantitative Data ว่าข้อมูลเชิงปริมาณคืออะไร ข้อมูลเชิงปริมาณในแต่ละประเภทย่อยคืออะไร และวิธีการจำแนกข้อมูลเหล่านั้น รวมไปถึงตัวอย่างของข้อมูลในแต่ละประเภทครับ

 

 

“Quantitative Data” หรือ “ข้อมูลเชิงปริมาณ” คืออะไร? 

Quantitative Data หรือ ข้อมูลเชิงปริมาณคือข้อมูลในรูปแบบหนึ่งที่สามารถวัดค่าออกมาเป็นตัวเลขได้อย่างชัดเจน ซึ่งชนิดข้อมูลเหล่านี้จะเป็นตัวเลขโดยสามารถวัดออกมาเป็นปริมาณว่ามีจำนวนมากหรือน้อย ตัวอย่างข้อมูลเชิงปริมาณได้แก่ น้ำหนัก, ส่วนสูง, จำนวนประชากร, อุณหภูมิ โดยข้อมูลประเภทนี้สามารถนำเอาไปประยุกต์ใช้กับวิชาทางสถิติได้ง่าย เช่นการหาค่าเฉลี่ย (Mean), ค่ากลาง (Median) หรือ ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) รวมไปถึงการทำ Data Visualization เพื่อแสดงผลของข้อมูลออกมาเป็นการ Plot graph หรือ Line Chart โดยข้อมูลเชิงปริมาณสามารถแยกออกเป็นอีก 2 ประเภทย่อยได้แก่ 

 

Discrete Data

Discrete Data

Discrete Data คือข้อมูลเชิงปริมาณที่ไม่มีความต่อเนื่อง โดยเป็นชุดของตัวเลขที่วัดได้ด้วยการนับ (Count) ซึ่งค่าที่วัดได้นั้นเป็นค่าที่มีความจำเพาะไม่สามารถแยกย่อยออกมาเป็นจุดทศนิยมได้ส่งผลให้เวลา Plot graph ออกมาในรูปแบบของ Scatter graph ค่าที่ได้จะเป็นลักษณะจุดที่ไม่มีความต่อเนื่องกันของเส้นกราฟตัวอย่างเช่น จำนวนกาแฟที่ขายได้ต่อวัน จะพบว่าการวัดจำนวนแก้วกาแฟที่ขายได้นั้นใช้วิธีการนับ ซึ่งจำนวนแก้วกาแฟที่ขายได้นั้นจะเป็นจำนวนเต็ม จะไม่สามารถนับได้เป็นจำนวน 7.2 แก้ว หรือจำนวนนักเรียนในห้องเรียนมีลักษณะคล้ายกันคือใช้การนับจำนวนโดยจำนวนนักเรียนที่นับได้จะไม่สามารถนับได้เป็นจำนวน 20.5 คน

Continuous Data

Continuous Data

Continuous Data คือข้อมูลเชิงปริมาณที่มีความต่อเนื่องของข้อมูล โดยเป็นชุดข้อมูลที่วัดได้ด้วยการใช้วิธีการวัดค่าในเชิงปริมาณ (Measure) ซึ่งค่าที่วัดได้นั้นจะไม่มีความจำเพาะของค่าที่วัด ค่าที่ได้ทำให้สามารถแยกย่อยออกมาเป็นจุดทศนิยมส่งผลให้เวลา Plot graph ออกมาในรูปแบบของ Scatter graph ค่าที่ได้จะเป็นลักษณะของจุดที่มีความต่อเนื่องกันของเส้นกราฟ ทำให้กราที่ได้เป็นเส้นโค้ง ตัวอย่างเช่น การวัดส่วนสูง พบว่าวิธีการวัดส่วนสูงจะไม่ใช่การนับแต่จะเป็นการใช้ไม้วัดส่วนสูงโดยวัดได้เป็น 171.4 ซึ่งค่าที่วัดได้จะมีจุดทศนิยม

ตัวอย่างการจำแนกข้อมูลเชิงปริมาณ 

1. ความเร็วของรถยนต์

อันดับแรกต้องแยกก่อนว่าข้อมูลความเร็วของรถยนต์นั้นเป็นข้อมูลเชิงปริมาณหรือคุณภาพ ซึ่งเมื่อพิจารณาแล้วพบว่าข้อมูลสามารถวัดออกมาเป็นตัวเลขได้เป็นหน่วยความเร็วเช่น กิโลเมตรต่อชั่วโมง รวมไปถึงตัวเลขที่วัดออกมาสามารถทำเป็นจุดทศนิยมได้ดังนั้นจึงบอกได้ว่าเป็นข้อมูลเชิงปริมาณแบบ Continuous Data

2.ปริมาณรถยนต์ไฟฟ้าในประเทศไทย

เมื่อวิเคราะห์จากข้อมูลจะพบว่าเป็นข้อมูลเชิงปริมาณเนื่องจากจำนวนรถยนต์สามารถคำนวณออกมาเป็นตัวเลขว่าจำนวนรถกี่คัน โดยจำนวนรถยนต์ต้องใช้วิธีการนับและค่าที่ได้ไม่สามารถทำเป็นจุดทศนิยมได้จึงบอกได้ว่าเป็นข้อมูลเชิงปริมาณแบบ Discrete Data

3.อายุ

ข้อมูลอายุนั้นเป็นข้อมูลเชิงปริมาณเนื่องจากเราสามารถคำนวณอายุคนออกมาเป็นตัวเลขได้ แต่ประเด็นที่มีความน่าสนใจคือข้อมูลอายุคนที่นำมาวิเคราะห์นั้นเป็นแบบไหน ถ้าข้อมูลอายุที่เป็นตัวเลขแน่นอนทั่วไปไม่ได้คิดรายละเอียดเรื่องเดือนเข้าไป เช่น อายุ 25 ปี 30 ปี ข้อมูลเหล่านี้จะเป็นแบบ Discrete Data เพราะข้อมูลเป็นตัวเลขที่มีค่าที่แน่นอน แต่ถ้าข้อมูลอายุที่เป็นในลักษณะของการนำเอาเดือนเข้ามาคิดด้วย เช่น อายุ 40.5 ปี หรือ 60.7 ปี ก็จะเป็นข้อมูลแบบ Continuous Data เพราะข้อมูลเป็นตัวเลขที่มีจุดทศนิยม

 

สรุป

ความรู้เรื่องข้อมูลหรือ Data นั้นมีความสำคัญมากเนื่องจากเป็นความรู้พื้นฐานของวิชาสถิติซึ่งเป็นหนึ่งในความรู้หลักที่นักวิทยาศาสตร์ข้อมูลจำเป็นต้องมีเพื่อใช้ในกระบวนการตั้งแต่การคัดแยกข้อมูลว่าข้อมูลไหนเหมาะสมที่จะนำเอามาใช้วิเคราะห์ การดูภาพรวมข้อมูลด้วยการใช้วิชาทางสถิติ รวมไปถึงการสรุปผลและการนำเสนอข้อมูลเพื่อที่เราจะได้เลือกวิธีการจัดการและนำเสนอข้อมูลได้อย่างเหมาะสมกับชุดข้อมูล

 

ที่มา

 

Like 2

user name

คำไม่ถูกต้อง กรุณาลองใหม่อีกครั้ง

ความคิดเห็น (0)