خصائص الحجم والسرعة والتنوع في علم البيانات

اقرأ في هذا المقال


من الضروري أن يكون هناك فهم أعمق لأي شيء واسع، وستساعد الخصائص في فك تشفير البيانات الضخمة ويمكن التحكم فيها في فترة زمنية مناسبة ممّا يسمح باستخراج القيمة منها وإجراء تحليل في الوقت الفعلي.

ما هي خصائص الحجم والسرعة والتنوع

1- مقدار الحجم

  • في السيناريو الحالي أهمية كمية البيانات التي تحتاجها الشركات، ولتحليلات البيانات الضخمة ستحتاج إلى معالجة كميات أكبر من البيانات المهيكلة وغير المهيكلة.
  • يمكن أن تكون هذه البيانات ذات قيمة غير محددة مثل: مجموعات بيانات (Facebook) و(Instagram) أو بيانات على العديد من تطبيقات الويب أو الهاتف المحمول.
  • وفقًا لاتجاهات السوق سيزداد حجم البيانات بشكل كبير في السنوات القادمة وهناك مجال كبير لتحليل البيانات الشامل واكتشاف الأنماط.

2- السرعة

  • تشير السرعة إلى سرعة معالجة البيانات، حيث يُعد معدل معالجة البيانات الأعلى أمرًا مهمًا لتقييم وأداء إجراء البيانات الضخمة في الوقت الفعلي.
  • سيكون الوصول إلى المزيد من البيانات متاحًا في المستقبل لكنّ سرعة المعالجة ستكون مهمة بنفس القدر للشركات للاستفادة من تحليلات البيانات الضخمة.
  • تتعامل سرعة البيانات الكبيرة مع السرعة التي تتدفق بها البيانات من مصادر مثل: العمليات التجارية والآلات والشبكات والتفاعل البشري مع أشياء مثل: مواقع التواصل الاجتماعي والأجهزة المحمولة وما إلى ذلك.
  • تدفق البيانات هائل ومستمر، ويمكن أن تساعد هذه البيانات في الوقت الفعلي الباحثين والشركات على اتخاذ قرارات قيمة توفر مزايا تنافسية استراتيجية وعائد استثمار إذا كنت قادرًا على التعامل مع السرعة.

3- التنوع

  • التنوع يشير إلى فئات متنوعة من البيانات الضخمة، حيث إنّه من بين التحديات الرئيسية التي تواجهها صناعة البيانات الضخمة لأنّها تغير على الإنتاجية.
  • مع تزايد استخدام البيانات الضخمة تأتي البيانات في مجموعات بيانات جديدة، وتحتاج فئات البيانات المختلفة مثل: النص والصوت والفيديو إلى معالجة مسبقة إضافية لدعم البيانات الوصفية واشتقاق قيمة محسّنة.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: