Data Innovation and Governance Institute, DIGI
2029 Views
Science, Digital Technology and Innovation
เปรียบเทียบชัด! Structured กับ Unstructured Data คืออะไร?
22 Aug 2022
วันนี้ DIGI จะพาทุกคนไปทำความรู้จักกับข้อมูล หรือ “Data” รายละเอียดที่เกี่ยวข้องกับประเภทของข้อมูลว่าในแต่ละรูปแบบมีความแตกต่างกันอย่างไร
เปรียบเทียบชัด! Structured กับ Unstructured Data คืออะไร?
ในปัจจุบันข้อมูลหรือ “Data” เข้ามามีบทบาทสำคัญในการดำเนินธุรกิจตั้งแต่ SME ซึ่งเป็นธุรกิจขนาดย่อมไปจนถึงบริษัทที่มีขนาดใหญ่ที่มีชื่อเสียงในระดับโลก ซึ่งการที่เราจะใช้ประโยชน์จากข้อมูลได้มีประสิทธิภาพมากที่สุดนั้นเราจำเป็นจะต้องทำความเข้าใจถึงข้อมูลให้มีความลึกซึ้งมากพอที่จะสามารถนำมาใช้ในการวิเคราะห์เพื่อหาความสัมพันธ์กันระหว่างข้อมูลซึ่งสุดท้ายจะก่อให้เกิดแนวทางที่จะช่วยให้ธุรกิจสามารถดำเนินไปได้อย่างราบรื่น
ดังนั้นวันนี้ DIGI จะพาทุกคนไปทำความรู้จักกับข้อมูล หรือ “Data” โดยจะเจาะลึกถึงรายละเอียดที่เกี่ยวข้องกับประเภทของข้อมูลได้แก่ Structured data หรือข้อมูลที่เป็นโครงสร้าง Unstructured data หรือข้อมูลที่ไม่เป็นโครงสร้าง และ Semi-structured data ข้อมูลกึ่งโครงสร้างว่าในแต่ละรูปแบบมีความแตกต่างกันอย่างไร รวมไปถึงตัวอย่างเพื่อให้ผู้อ่านเกิดความเข้าใจในเรื่องข้อมูลมากยิ่งขึ้น
ประเภทของข้อมูลทั้ง 3 รูปแบบ
ในส่วนของข้อมูลหรือ “Data” ถ้าเราจะนำแบ่งประเภทตามลักษณะโครงสร้างของข้อมูลเราจะพบว่าสามารถแบ่งข้อมูลออกเป็น 3 ประเภทได้แก่
- Structured data
Structured data เป็นข้อมูลที่มีการจัดเก็บไว้ในรูปแบบหรือโครงสร้างที่ชัดเจนนักวิทยาศาสตร์ข้อมูลสามารถนำไปใช้ได้ง่ายเช่น ข้อมูลที่อยู่ในรูปของไฟล์ CSV หรือไฟล์ Excel ซึ่งข้อมูลในรูปแบบนี้จะอยู่ในรูปแบบตาราง ถ้าเราลองสังเกตเวลาใช้งานข้อมูลรูปแบบนี้จะเห็นหัวข้ออยู่ตรงแถวกับคอลัมน์ทำให้เราสามารถเข้าใจถึงข้อมูลได้ในทันที และสามารถนำมาจัดเรียงข้อมูลใน Database สามารถนำเอาไปใช้ในโปรแกรม SQL อย่างง่ายดาย
ตัวอย่างของข้อมูล Structured data ได้แก่ ข้อมูลในตาราง Excel เช่น ชื่อ, อายุ, น้ำหนัก, ส่วนสูง ซึ่งข้อมูลเหล่านี้สามารถนำเอาไปใช้งานได้เลยทันที
- Unstructured data
Unstructured data เป็นข้อมูลที่ไม่มีโครงสร้างที่ชัดเจน หลายคนอาจจะงงกับคำว่าข้อมูลที่ไม่มีโครงสร้างถ้าจะพูดให้ง่ายขึ้นข้อมูลเหล่านี้จะเป็นข้อมูลในรูปแบบของรูปภาพ คลิปวิดีโอ ไฟล์เสียง หรือเป็นข้อความที่เราคุยกันบนโลกออนไลน์ ซึ่งจะเห็นได้ว่าข้อมูลเหล่านี้มีจำนวนมากกว่าข้อมูลในรูปแบบ Structured data และเป็นข้อมูลที่ทำให้เกิด Big Data
เพราะในยุคปัจจุบันที่ทุกคนสามารถเข้าถึง Internet และ Application ต่าง ๆ ส่งผลให้ผู้ใช้งานบนโลกออนไลน์มากขึ้นก็จะยิ่งทำให้ข้อมูลในรูปแบบ Unstructured data ยิ่งเพิ่มขึ้นมากตาม ส่งผลให้เวลาจะนำข้อมูลที่เป็น Unstructure data มาใช้งานทำให้เกิดความยุ่งยาก จำเป็นต้องใช้เครื่องมือเพื่อแปลงให้เป็นข้อมูล Structure data ก่อนนำไปใช้งาน ซึ่งถ้ามีคนสามารถแปลงข้อมูลเหล่านี้แล้วนำไปใช้งานก็จะทำให้มองเห็น Insight ของข้อมูลทำให้เกิดความได้เปรียบในการแข่งขันทางธุรกิจ
- Semi-structured data
ข้อมูลกึ่งโครงสร้างเกิดจากการอยู่ระหว่างกลางของ Structure data ซึ่งเป็นข้อมูลที่สามารถนำไปใช้งานได้ง่าย แต่มีความยากในการกำหนดโครงสร้างเพื่อจัดเก็บข้อมูล และ Unstructured data ซึ่งเป็นข้อมูลที่ยากต่อการนำไปใช้งาน แต่ง่ายในการจัดเก็บ
ซึ่ง Semi-structured data เอาข้อดีของข้อมูลทั้ง 2 รูปแบบมาคือใช้การเก็บข้อมูลในรูปแบบของ Unstructured data แต่ทำให้อยู่ในรูปแบบที่พร้อมใช้งานได้ง่ายเหมือนกับ Structure data
ตัวอย่างข้อมูลในรูปแบบ Semi-structured data ได้แก่ Hash-tag ตามโลกออนไลน์ซึ่งรูปแบบการเก็บข้อมูลคือจะเป็นโพสต์หรือรูปภาพ แต่เราสามารถดึงมาใช้งานได้ง่ายขึ้นจากการที่เราเลือก Hash-tag ที่เฉพาะเจาะจง
สรุป
รูปแบบของโครงสร้างข้อมูลทั้ง 3 รูปแบบมีความแตกต่างกันตามโครงสร้างรวมไปถึงวิธีการใช้งาน ซึ่งข้อมูลแบบ Structure data ง่ายต่อการใช้งาน แต่มีความยากในการสร้างรูปแบบการจัดเก็บ Unstructured data สามารถจัดเก็บได้ง่าย แต่การที่จะประยุกต์มาเป็นข้อมูล Structure data เพื่อนำไปวิเคราะห์ต่อนั้นมีความยาก ส่วน Semi-structured data เป็นข้อมูลที่อยู่กึ่งกลางระหว่างทั้ง 2 รูปแบบ โดยข้อมูลแต่แบบก็จะมีข้อดีและข้อเสียที่แตกต่างกันไปขึ้นอยู่กับผู้ใช้งานจะเลือกเอาข้อมูลแบบไหนไปก่อให้เกิดประโยชน์ในการดำเนินธุรกิจ
ที่มา
- https://www.everydaymarketing.co/knowledge/data-101-how-different-structured-unstructured-and-semi-structured-data/
- https://www.g2.com/articles/structured-vs-unstructured-data
- https://www.coraline.co.th/single-post/structured-data-vs-unstructured-data
Like 0
Incorrect words. Please try again.
Comments (0)