Big Data คืออะไร?
Big Data คือ ข้อมูลขนาดใหญ่/ปริมาณมาก หรือ ข้อมูลจำนวนมากมหาศาล ทุกเรื่อง ทุกแง่มุม ทุกรูปแบบ ซึ่งอาจเป็นข้อมูลที่มีโครงสร้างชัดเจน (Structured Data) เช่น ข้อมูลที่เก็บอยู่ในตารางข้อมูลต่างๆ หรืออาจเป็นข้อมูลกึ่งมีโครงสร้าง (Semi-Structured Data) เช่น ล็อกไฟล์ (Log files) หรือแม้กระทั่งข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data) เช่น ข้อมูลการโต้ตอบปฏิสัมพันธ์ผ่านสังคมเครือข่าย (Social Network) เช่น Facebook, twitter หรือ ไฟล์จำพวกมีเดีย เป็นต้น ซึ่งอาจจะเป็นข้อมูลภายในองค์กรและภายนอกที่มาจากการติดต่อระหว่างองค์กร หรือจากทุกช่องทางการติดต่อกับลูกค้า แต่ทั้งหมดนี้ก็ยังคงเป็นเพียงข้อมูลดิบที่รอการนำมาประมวลและวิเคราะห์เพื่อนำผลที่ได้มาสร้างมูลค่าทางธุรกิจ ข้อมูลเหล่านี้อาจจะไม่ได้อยู่ในรูปแบบที่องค์กรสามารถนำไปใช้ได้ทันที แต่อาจมีข้อมูลที่เป็นประโยชน์ต่อองค์กรบางอย่างแฝงอยู่
มีคุณลักษณะสำคัญอยู่ 4 อย่าง คือ
- ปริมาตร (Volume) หมายถึง ข้อมูลนั้นมันต้องมีขนาดใหญ่มาก ซึ่งไม่สามารถประมวลผลปริมาณของข้อมูลด้วยระบบฐานข้อมูลได้ จำเป็นต้องใช้คลังข้อมูล (Data Warehouse) และซอฟต์แวร์ฮาดูป (Hadoop) ทำงานประสานกันในการบริหารจัดการข้อมูล
- ความเร็ว (Velocity) หมายถึง ข้อมูลดังกล่าวต้องมีอัตราการเพิ่มขึ้นอย่างรวดเร็ว เช่น ข้อมูลจากภาพถ่ายโทรศัพท์ที่ถูกอับโหลดขึ้น ข้อมูลการพิมพ์สนทนา ข้อมูลวิดีโอ รวมไปถึงข้อมูลการสั่งซื้อสินค้า
- ความหลากหลาย (Variety) หมายถึง รูปแบบข้อมูลต้องมีความหลากหลาย อาจจะเป็นข้อมูลที่มีโครงสร้าง ไม่มีโครงสร้าง และกึ่งมีโครงสร้าง รูปแบบข้อมูลของ Big Data มันมีทุกอย่าง ไม่ได้จำกัดแค่พวกข้อความ อีเมล์ รูปภาพ ฯลฯ เท่านั้น
- Veracity ไม่สามารถนำมาใช้เป็นข้อมูลที่สมบูรณ์ เพื่อการประกอบการพิจารณาได้
- บทความสาธารณะ Wikipedia https://th.wikipedia.org/wiki/ข้อมูลขนาดใหญ่
- G-ABLE
- Aware Group
- Big data IBM Analytics
ไม่มีความคิดเห็น:
แสดงความคิดเห็น