البيانات الضخمة Big Data

اقرأ في هذا المقال


ما الفرق بين البيانات والمعلومات؟

قبل أن نبدأ بتعريف البيانات الضخمة، لا بد في البداية أن ندرك ما هي البيانات؟ وكيف تختلف عن المعلومات؟ في الواقع البيانات هي الشكل الأولي لأي محتوى نقوم بإنتاجه، ولتوضيح ذلك فلو كان لديك عشرة أشخاص مثلاً، وقمت بقياس أطوالهم وسجلتها على ورقة، هذه الورقة تحمل البيانات.
وأما المعلومات فهي ناتج أية عملية معالجة للبيانات الأولية، ويقصد بها لوأخذت أطول هؤلاء الأشخاص العشرة في نفس المثال وقمت بالحصول على متوسط حسابي لها، هذا المتوسط هو معلومة، لأنه يعطي مقياس مفيد. بينما البيانات مجرد أرقام مسجلة على ورقة.

أقسام البيانات:

ويمكن أن تقسم البيانات الخام إلى ثلاثة أنواع:

  • بيانات مهيكلة: وهي البيانات المنظّمة في جداول أو قواعد بيانات.
  • بيانات غير مهيكلة: تشكّل النسبة الأكبر من البيانات، وهي البيانات التي ينتجها الأشخاص بشكل يومي من كتابات نصية وصور وفيديو ورسائل ونقرات على مواقع الإنترنت.
  • بيانات شبه مهيكلة: تعتبر نوع من البيانات المهيكلة إلا أن البيانات لا تكون في صورة جداول أو قواعد بيانات.

متى بدأ مصطلح البيانات الضخمة؟

البيانات الضخمة (Big Data):

تم تعريف البيانات الضخمة (Big Data) في عام 2011 من قبل معهد ماكنزي العالمي، حيث عُرّفت من خلال ذلك على أنها أي مصطلح متطور يصف حجم كبير من البيانات التي تأتي من مصادر مختلفة لا تُعد ولا تُحصى، فهي بذلك بحجم يفوق قدرة أدوات قواعد البيانات التقليدية، والتدفق الهائل لإتاحة البيانات الضخمة خصوصاً مع بروز الذكاء الاصطناعي وإنترنت الأشياء. وتتيح التطوارات في مجال الحوسبة الرقمية وعلم البيانات من جمع وتخزين البيانات الضخمة وصولاً إلى القدرة على إدارة وتحليل هذه البيانات.

من ماذا تتألف البيانات الضخمة؟

تتألف البيانات الضخمة من كل من المعلومات المنظمة والتي هي عبارة جزء قليل قد يصل إلى 10% فقط، وذلك مقارنة بالمعلومات غير المنظمة والتي تشكّل الجزء الأكبر المُتبقي، وبذلك فإنّ المعلومات غير المنظمة هي ما ينتجه البشر جميعاً من معلومات، لتشمل جميع الرسائل في البريد الإلكتروني، مقاطع الفيديو، التغريدات، منشورات فيس بوك، رسائل الدردشة على الواتساب، النقرات على المواقع وغيرها. وهذه (Big data) أصبحت واقع نعيشه، حتى أن قاموس أوكسفورد اعتمد المصطلح وإضافته للقاموس مع مصطلحات مستحدثة أخرى مثل التغريدة (tweet).

ما مدى ضخامة هذه البيانات؟

تعتبر البيانات الضخمة من أهم التوجهات التقنية الحديثة، والتي تعمل على إنشاء القيم الفعالة في مختلف القطاعات عن طريق مسح وتحليل البيانات، ومع مرور الزمن أصبحت البيانات التي ينتجها المستخدمين تنمو بشكل متسارع لعدة أسباب، منها بيانات المشتريات في محلات السوبر ماركت والأسواق التجارية، وفواتير الشحن والمصارف والصحة ومواقع التواصل الاجتماعي.

ومع تطوير تقنيات الذكاء الاصطناعي ومن أهمها التعرف على الوجه والأشخاص باختلافهم، وكذلك أجهزة إنترنت الأشياء والمنازل الذكية، فإنها ستتمكن من العثور على المزيد من التفاصيل والمعلومات عن أي شخص، ومع تزايد عدد الأجهزة المتصلة بالإنترنت، الأجهزة التي لم نعتد عليها أن تتصل بالشبكة العالمية مثل السيارات والبرادات والغسالات فإنها كلها تساهم في زيادة حجم البيانات المنتجة.


شارك المقالة: