คำว่า data ไม่ใช่เรื่องใหม่สำหรับเรา เป็นหนึ่งในสิ่งสำคัญที่สอนเมื่อคุณเลือกใช้เทคโนโลยีสารสนเทศและคอมพิวเตอร์ หากคุณจำได้ ข้อมูลถือเป็นรูปแบบข้อมูลดิบ แม้ว่าจะมีมานานนับทศวรรษแล้ว คำว่า Big Data เป็นกระแสในทุกวันนี้ ดังที่เห็นได้ชัดจากคำนี้ การโหลดและการโหลดของข้อมูล คือ Big Data และสามารถประมวลผลได้หลายวิธีโดยใช้วิธีการและเครื่องมือต่างๆ เพื่อจัดหาข้อมูลที่จำเป็น บทความนี้จะกล่าวถึงแนวคิดของ Big Data โดยใช้ 3 Vs ที่ Doug Laney กล่าวถึง ผู้บุกเบิกด้าน data warehousing ซึ่งถือว่าเป็นผู้ริเริ่มด้าน Infonomics (เศรษฐศาสตร์สารสนเทศ).

ก่อนที่คุณจะดำเนินการต่อ คุณอาจต้องการอ่านบทความของเราเกี่ยวกับพื้นฐานของข้อมูลขนาดใหญ่และการใช้ข้อมูลขนาดใหญ่เพื่อทำความเข้าใจสาระสำคัญ พวกเขาอาจเพิ่มในโพสต์นี้เพื่ออธิบายเพิ่มเติมเกี่ยวกับแนวคิด Big Data

ข้อมูลขนาดใหญ่ 3 Vs

ข้อมูลในรูปแบบขนาดใหญ่ที่สะสมด้วยวิธีการต่างๆ ถูกจัดเก็บอย่างถูกต้องในฐานข้อมูลต่างๆ ก่อนหน้านี้ และถูกทิ้งหลังจากผ่านไประยะหนึ่ง เมื่อแนวคิดปรากฏว่ายิ่งมีข้อมูลมากเท่าไร ก็ยิ่งง่ายต่อการค้นหา – ข้อมูลที่แตกต่างและเกี่ยวข้อง – โดยใช้เครื่องมือที่เหมาะสม บริษัทต่างๆ ก็เริ่มจัดเก็บข้อมูลเป็นระยะเวลานานขึ้น สิ่งนี้เหมือนกับการเพิ่มอุปกรณ์จัดเก็บข้อมูลใหม่หรือใช้ระบบคลาวด์เพื่อจัดเก็บข้อมูลในรูปแบบใดก็ตามที่ข้อมูลได้รับ: เอกสาร สเปรดชีต ฐานข้อมูล และ HTML เป็นต้น จากนั้นจะถูกจัดเรียงให้อยู่ในรูปแบบที่เหมาะสมโดยใช้เครื่องมือที่สามารถประมวลผลชิ้นส่วนขนาดใหญ่ได้ ข้อมูล.

หมายเหตุ: ขอบเขตของ Big Data ไม่จำกัดเฉพาะข้อมูลที่คุณรวบรวมและจัดเก็บไว้ในสถานที่และระบบคลาวด์ของคุณ ซึ่งอาจรวมถึงข้อมูลจากแหล่งอื่นๆ ซึ่งรวมถึงแต่ไม่จำกัดเฉพาะรายการที่เป็นสาธารณสมบัติ

โมเดล 3 มิติของ Big Data ขึ้นอยู่กับ Vs ต่อไปนี้:

  1. ปริมาณ: หมายถึงการจัดการการจัดเก็บข้อมูล
  2. ความเร็ว: หมายถึงความเร็วของการประมวลผลข้อมูล
  3. วาไรตี้: หมายถึงการจัดกลุ่มข้อมูลของชุดข้อมูลต่าง ๆ ที่ดูเหมือนไม่เกี่ยวข้องกัน

ย่อหน้าต่อไปนี้จะอธิบายการสร้างแบบจำลอง Big Data โดยพูดถึงแต่ละมิติ (แต่ละ V) อย่างละเอียด

A]ปริมาณบิ๊กดาต้า

เมื่อพูดถึง Big Data อาจมีคนเข้าใจปริมาณข้อมูลดิบจำนวนมาก แม้ว่าจะเป็นความจริง แต่ก็เกี่ยวกับต้นทุนการจัดเก็บข้อมูลด้วย ข้อมูลสำคัญสามารถจัดเก็บได้ทั้งในองค์กรและบนคลาวด์ โดยตัวเลือกหลังนี้เป็นทางเลือกที่ยืดหยุ่น แต่คุณจำเป็นต้องจัดเก็บและทุกอย่างหรือไม่?

จากรายงานของ Meta Group เมื่อปริมาณข้อมูลเพิ่มขึ้น ข้อมูลบางส่วนก็เริ่มไม่จำเป็น นอกจากนี้ ยังระบุด้วยว่าควรเก็บรักษาเฉพาะปริมาณข้อมูลที่ธุรกิจตั้งใจจะใช้เท่านั้น ข้อมูลอื่นอาจถูกละทิ้งหรือหากธุรกิจไม่เต็มใจที่จะปล่อย supposedly non-important dataพวกเขาสามารถทิ้งบนอุปกรณ์คอมพิวเตอร์ที่ไม่ได้ใช้และแม้แต่ในเทปเพื่อให้ธุรกิจไม่ต้องจ่ายเงินสำหรับการจัดเก็บข้อมูลดังกล่าว

ฉันใช้ supposedly unimportant data เพราะผมเองก็เชื่อเช่นกันว่าธุรกิจใดๆ สามารถต้องการข้อมูลประเภทใดก็ได้ในอนาคต ไม่ช้าก็เร็ว ดังนั้นจึงจำเป็นต้องเก็บไว้เป็นระยะเวลาพอสมควรก่อนที่คุณจะรู้ว่าข้อมูลนั้นไม่สำคัญจริงๆ โดยส่วนตัวแล้วฉันถ่ายโอนข้อมูลเก่าไปยังฮาร์ดดิสก์จากปีกลายและบางครั้งก็เป็นดีวีดี คอมพิวเตอร์หลักและที่เก็บข้อมูลบนคลาวด์มีข้อมูลที่ฉันคิดว่าสำคัญและรู้ว่าฉันจะใช้ ท่ามกลางข้อมูลนี้ด้วย มีข้อมูลประเภทหนึ่งที่ใช้ครั้งเดียวที่อาจจบลงบน HDD เก่าหลังจากไม่กี่ปี ตัวอย่างข้างต้นเป็นเพียงเพื่อความเข้าใจของคุณ มันไม่เหมาะกับคำอธิบายของ Big Data เนื่องจากจำนวนนั้นค่อนข้างน้อยกว่าเมื่อเปรียบเทียบกับสิ่งที่องค์กรมองว่าเป็น Big Data

B]ความเร็วในข้อมูลขนาดใหญ่

ความเร็วในการประมวลผลข้อมูลเป็นปัจจัยสำคัญเมื่อพูดถึงแนวคิดของ Big Data มีเว็บไซต์มากมายโดยเฉพาะอีคอมเมิร์ซ Google ยอมรับแล้วว่าความเร็วในการโหลดหน้าเว็บเป็นสิ่งจำเป็นสำหรับการจัดอันดับที่ดีขึ้น นอกเหนือจากการจัดอันดับ ความเร็วยังให้ความสะดวกสบายแก่ผู้ใช้ในขณะที่พวกเขาซื้อของ เช่นเดียวกับข้อมูลที่กำลังประมวลผลสำหรับข้อมูลอื่น

ในขณะที่พูดถึงความเร็ว สิ่งสำคัญคือต้องรู้ว่ามันอยู่นอกเหนือแค่แบนด์วิดท์ที่สูงกว่า รวมข้อมูลที่ใช้งานได้พร้อมเครื่องมือวิเคราะห์ต่างๆ ข้อมูลที่ใช้งานได้ทันทีหมายถึงการบ้านบางอย่างเพื่อสร้างโครงสร้างของข้อมูลที่ง่ายต่อการประมวลผล มิติต่อไป – วาไรตี้ กระจายความกระจ่างเพิ่มเติมเกี่ยวกับเรื่องนี้

C]ความหลากหลายของข้อมูลขนาดใหญ่

เมื่อมีข้อมูลจำนวนมาก สิ่งสำคัญคือต้องจัดระเบียบข้อมูลเหล่านี้ในลักษณะที่เครื่องมือวิเคราะห์สามารถประมวลผลข้อมูลได้อย่างง่ายดาย มีเครื่องมือในการจัดระเบียบข้อมูลด้วย เมื่อจัดเก็บ ข้อมูลสามารถไม่มีโครงสร้างและอยู่ในรูปแบบใดก็ได้ ขึ้นอยู่กับคุณว่าจะรู้ว่ามีความสัมพันธ์กับข้อมูลอื่นกับคุณอย่างไร เมื่อคุณทราบความสัมพันธ์แล้ว คุณสามารถเลือกเครื่องมือที่เหมาะสมและแปลงข้อมูลเป็นรูปแบบที่ต้องการสำหรับการจัดเก็บที่มีโครงสร้างและจัดเรียง

สรุป

กล่าวอีกนัยหนึ่ง Big Datas 3D Model ขึ้นอยู่กับสามมิติ: ข้อมูล USABLE ที่คุณมี; การติดแท็กข้อมูลที่เหมาะสม และประมวลผลเร็วขึ้น หากสามสิ่งนี้ได้รับการดูแล ข้อมูลของคุณสามารถประมวลผลหรือวิเคราะห์ได้อย่างง่ายดายเพื่อค้นหาสิ่งที่คุณต้องการ

ด้านบนจะอธิบายทั้งแนวคิดและโมเดล 3 มิติของ Big Data บทความที่เชื่อมโยงในวรรคที่สองจะพิสูจน์การสนับสนุนเพิ่มเติมหากคุณยังใหม่ต่อแนวคิดนี้

ต้องการเพิ่มเติมอะไร คอมเม้นได้เลย