ถ้าหากถามว่า คุณเคยได้ยินเรื่อง Big Data ไหม หลายคนประมาณสามในสี่ก็คงจะตอบว่า ‘เคยสิ’ แต่เมื่อเราคุยกันต่อว่า ‘แล้ว Big Data คืออะไร’ ความเงียบก็ได้เกิดขึ้น ถ้าคุณรู้สึกแบบเดียวกับเรา คุณมาถูกที่แล้ว เพราะเราก็เป็นคนหนึ่งที่เคยรู้สึกแบบนั้น และหลังจากอ่านบทความนี้ คุฌก็อาจจะเข้าใจ Big Data มากขึ้น เริ่มกันเลยค่ะ Show Big Data คืออะไรBig Data คือ การที่เรามีข้อมูลในขนาดใหญ่, ปริมาณมาก และ ความซับซ้อนสูง มาอยู่รวมกัน โดยที่เครื่องมือในการจัดการข้อมูลทั่วไป (traditional processing software) ไม่สามารถประมวลผลได้ Big Data มาจากไหน
Big Data ใหญ่ขนาดไหนกันถึงแม้ว่าจะไม่ได้มีการกำหนดว่า Big Data ต้องมีขนาดเท่าไหร่ แต่การใช้งานส่วนมากมักจะอยู่ในขนาด เทราไบต์ (Terabyte: TB = 1,000 GB), เพตะไบต์ (Petabyte: PB = 1,000 TB) หรืออาจจะใหญ่ขนาด เอ็กซาไบต์ (Exabyte: EB = 1,000,000 TB) เลยก็เป็นได้ ยกตัวอย่างให้เห็นภาพ ดาต้าถูกสร้างขึ้นเท่าไรในแต่ละนาทีต่อวัน [ขอบคุณรูปจาก Domo.com]จากสถิติด้าน Social media, Facebook สร้างข้อมูล 4 PB ต่อวัน ซึ่งก็คือประมาณ 4 ล้าน GB นั่นเอง ดูจากรูปจะเห็นได้ว่า
นอกจากนั้นจะเห็นได้ว่า Social media อื่นๆ ทั้ง Instagram, Twitters, TikTok หรือ WhatsApp ก็มีการสร้างข้อมูลในปริมาณมากไม่แพ้กัน คุณสมบัติ 4 อย่างของ Big Dataคุณสมบัติ 4 วี ของ บิ้กดาต้า IBM [ขอบคุณรูปจาก IBM]คุณสมบัติของ Big Data นั้น ไม่ได้มีแค่ปริมาณอย่างเดียว แต่ประกอบไปด้วยคุณสมบัติต่างๆดังต่อไปนี้ เรียกสั้นๆว่า 4 Vs
Big Data สำคัญอย่างไรบริษัทสามารถใช้ Big Data หรือข้อมูลขนาดใหญ่ที่เก็บไว้มาพัฒนาระบบ, กระบวนการ บริการลูกค้าให้ดียิ่งขึ้น, สร้างแคมเปญการตลาดเฉพาะบุคคลจากความชอบของลูกค้า และเพิ่มกำไรได้ในที่สุด เมื่อธุรกิจสามารถใช้ Big Data ให้เกิดประโยชน์ได้ ก็จะมีความสามารถในการแข่งขันสูงมากกว่าคนอื่น เพราะว่าใช้ในการตัดสินใจได้อย่างรวดเร็ว และเห็นข้อมูลเชิงลึกได้มากกว่า ยกตัวอย่าง Big Data ของลูกค้า มาดูกันว่าเราสามารถเอาไปทำอะไรได้บ้าง
เครื่องมือที่ใช้ในการจัดการ Big Dataโลโก้ Hadoopปกติแล้วเซิร์ฟเวอร์อันเดียว หรือแม้แต่หลายอันก็ไม่สามารถจัดการกับความใหญ่ของ Big Data ได้. ดังนั้นจึงต้องใช้เทคโนโลยีอย่าง Hadoop และ Apache Spark มาช่วยซึ่งสามารถประมวลผลข้อมูลขนาดใหญ่ และแบ่งออกไปให้อีกหลายๆเครื่องประมวลด้วย ใครสนใจเรื่อง Apache Spark ติดตามได้ในบทความถัดไปเลยค่ะ Apache Spark คืออะไร เครื่องมือ Big Data ที่ไม่รู้จักไม่ได้ อยากรู้วิธีการจัดการ Big Data โดยใช้ Pyspark ใน Apache Spark ลองเข้าไปดูได้ที่นี่เลย สุดท้ายนี้ถ้าใครมีคำถามหรือข้อสงสัย แนะนำให้ลองอ่านบทความอื่นๆในเว็บ DataTH ของเราเพิ่มเติม หรือเข้ามาคุยกันในเพจ Facebook เพจ DataTH ได้เลยค่า เรามีบทความอัพเดทให้เสมอๆ แล้วเจอกันนะคะ
ข้อมูลขนาดใหญ่มีอะไรบ้างBig Data คือ การเก็บรวบรวมข้อมูลที่มีทั้งหมดภายในองค์กรไม่ว่าจะเป็น ข้อมูลของบริษัท ข้อมูลติดต่อของลูกค้า ข้อมูลติดต่อของผู้ร่วมธุรกิจ. ข้อมูลตัวอักษรการสนทนา. ข้อมูลการบันทึกเสียง. ข้อมูลการถ่ายภาพวีดีโอ. ข้อมูลอัตราการสั่งซื้อสินค้า. ข้อมูลโปรโมชั่นต่างๆ. ข้อใดเป็นตัวอย่างของข้อมูลขนาดใหญ่Big Data หมายถึงชุดข้อมูลใดๆ ก็ตามที่มีขนาดใหญ่และถูกเก็บบันทึกไว้ผ่านวิธีการต่างๆ ยกตัวอย่างเช่นฐานข้อมูลภายในองค์กรของคุณเอง ไม่ว่าจะเป็นข้อมูลการทำ transaction ต่างๆ หรือข้อมูลพฤติกรรมของลูกค้า
คุณลักษณะสําคัญของข้อมูลขนาดใหญ่ (Big Data) ได้แก่อะไรบ้างBig Data เป็นข้อมูลขนาดใหญ่มหาศาล ที่สามารถนำผลที่ได้มาสร้างมูลค่าให้กับทางธุรกิจหรือองค์กรได้ ซึ่ง Big Data จะมีคุณลักษณะสำคัญคือ 5V ได้แก่ Volume, Velocity, Variety, Veracity และ Value โดยการทำงานกับ Big Data จะมีองค์ประกอบที่เริ่มตั้งแต่การนำเข้าข้อมูลจากแหล่งข้อมูล Big Data หลายแหล่งไปยังแหล่งเก็บข้อมูล และเมื่อเรา ...
|