ธุรกิจสามารถใช้ บิ๊กดาต้า(Big Data) ให้เกิดประโยชน์ได้ Big Data มีอิทธิพลต่อการใช้ชีวิตในโลกสมัยใหม่เป็นอย่างมาก แค่เพียงคุณแชทหาเพื่อนผ่านไลน์ คุยกับ Siri แชร์ภาพลงอินสตาแกรม ช้อปปิ้งผ่านลาซาด้า สั่งให้สมาร์ทวอชนับจำนวนก้าวที่คุณเดินในแต่ละวัน ทุกกิจกรรมที่เราทำล้วนเกี่ยวข้องกับ Big Data ทั้งนั้น และองค์กรต่างๆ ก็มีหน้าที่ใช้มันให้เกิดประโยชน์สูงสุด เพื่อการแข่งขัน และเพื่อความสะดวกสบายของพวกเราทุกคน

คำว่า ‘Big Data’ มีมานานแล้ว คำจำกัดความของมันนั้นยังไม่แน่นอน Tim O’Reilly ผู้เชี่ยวชาญด้านเทคโนโลยีอันดับต้นๆ ของโลก เคยเขียนไว้ในบล็อกส่วนตัวว่า

“Big Data หมายถึง ข้อมูลจำนวนมหาศาลที่ไม่สามารถนำไปคำนวณในระบบฐานข้อมูลปกติได้ มันเยอะเกิน เร็วเกิน หรือไม่ก็ไม่เหมาะกับโครงสร้างฐานข้อมูลที่จำกัดของคุณ”

ใครได้อ่านก็คงพยักหน้าตามกับคำอธิบายนี้ เพราะถ้าแปลตรงตัว Big Data ก็ควรจะหมายถึงข้อมูลเยอะๆ (ใหญ่ๆ) อยู่แล้ว แต่ยังมีคนอีกกลุ่มหนึ่งที่มองว่าความหมายนั้นล้าสมัยไปแล้ว และ Big Data ควรหมายถึง “เครื่องมือ” มากกว่าตัว “ข้อมูล” เอง ดังต่อไปนี้

“Big Data หมายถึง การผสมผสานของกระบวนการ เครื่องมือ และเทคโนโลยีใหม่ๆ ที่จัดการและประมวลผลชุดข้อมูลจำนวนมาก”

ส่วนคนอีกกลุ่มจับทั้ง 2 ความหมายมายำรวมกัน ดังต่อไปนี้

“Big Data หมายถึง ข้อมูลจำนวนมหาศาลที่เราผลิตออกมาบนโลกยุคดิจิตอล รวมถึงความสามารถในการวิเคราะห์และรวบรวมความเข้าใจเชิงลึกจากข้อมูลเหล่านั้น เพื่อนำมาใช้ให้เกิดประโยชน์สูงสุด ข้อมูลจะช่วยให้เราเข้าใจโลกมากขึ้นและเปลี่ยนวิถีการใช้ชีวิตของเราไปจากเดิม”

มากแค่ไหนถึงเรียกว่า Big Data?
รู้จักความหมายของ Big Data กันไปแล้ว แต่หลายคนก็ยังสงสัยว่า “แล้วข้อมูลจำนวนมากนี่มันมากแค่ไหน ถึงได้กลายเป็น Big Data?” แอดก็อยากจะตอบให้ชัดๆ ฟันธงไปเลยว่ามันมากกี่กิ๊กกะไบต์หรือกี่เทราไบต์ แต่ความเป็นจริงแล้ว Big Data ไม่สามารถวัดด้วยหน่วยปกติธรรมดาได้ เหตุเพราะการพิจารณา Big Data นั้นต้องมีคุณสมบัติ 3V ดังต่อไปนี้

-Volume หรือ ข้อมูลมีปริมาณมาก
-Variety หรือ ข้อมูลมีความหลากหลาย (มีทั้งไฟล์ภาพ ตัวอักษร วิดีโอ ตาราง ฯลฯ)
-Velocity หรือ ข้อมูลมีการเปลี่ยนแปลงหรือเพิ่มขึ้นอย่างรวดเร็ว

Big Data ทำงานยังไง?
ถ้าเรายึดตามความหมายช่วงแรกของ Big Data ที่ว่า “Big Data หมายถึง ข้อมูลจำนวนมหาศาลที่เราผลิตออกมาในโลกยุคดิจิตอล” ก็น่าจะเข้าใจได้ว่า Big Data ไม่ใช่เทคโนโลยีหรือโปรแกรมใดๆ ที่สามารถทำงานเองได้ มันต้องอาศัยโปรแกรมที่ถูกพัฒนาโดยเฉพาะในการจัดเก็บและดำเนินการเพื่อให้ออกมาเป็นผลลัพธ์ตามที่ผู้ใช้ต้องการ ไม่ว่าจะเป็นการทำนายอนาคต ค้นหากลุ่มเป้าหมายที่ใช่ ค้นหาสินค้าที่ลูกค้าชื่นชอบ เป็นต้น

แต่ถ้าเราพิจารณาความหมายในส่วนหลังของ Big Data ที่ว่า “รวมถึงความสามารถในการวิเคราะห์และรวบรวมความเข้าใจเชิงลึกจากข้อมูลเหล่านั้น” เราก็จะรู้ได้ว่า Big Data นั้นหมายรวมถึงเทคโนโลยี ซอฟต์แวร์ และโปรแกรมต่างๆ ที่มนุษย์พัฒนาขึ้นมาจัดการตัวข้อมูลด้วย ซึ่งโปรแกรมที่องค์กรต่างๆ นิยมใช้กันเพื่อจัดการข้อมูลที่ว่าก็คือ Hadoop มันเป็นโอเพ่นซอร์สที่ใช้งานง่ายและค่าใช้จ่ายไม่สูงมาก (เปิดให้ใช้งานฟรี และสามารถจัดเก็บชุดข้อมูลขนาดมหึมาบนฮาร์ดแวร์ที่ราคาถูกกว่า super computer ได้)