ما هي أصناف خاصية التنبؤ في علم البيانات

اقرأ في هذا المقال


عندما تتم مناقشة علم البيانات اليوم فعادةً ما يتعلق الأمر بأحدث وأكبر خوارزميات التعلم العميق أو التعلم الآلي والتنبؤ، ولكن يجب على عالم البيانات إنشاء واستيعاب العديد من المفاهيم والممارسات الأساسية لتنبؤ البيانات.

أصناف خاصية التنبؤ في البيانات

1- الاستدلال

  • نُهج مجال دراسات الإحصاءات الاستدلالية المستخدمة لاكتساب نظرة ثاقبة حول مجموعة البيانات التي لا يمكننا مراقبتها بشكل كامل باستخدام عينة قمنا بجمعها، إمّا من البيانات المتاحة أو عن طريق إجراء تجربة.
  • تشمل الأساليب الشائعة التعلم الآلي والتعلم العميق، وفي كلتا الحالتين يتلائم نموذج مع عينة من البيانات ويتم استخدامه لتقدير العلاقات بين المتغيرات.

2- النماذج الخاضعة للإشراف وغير الخاضعة للإشراف

  • تُعد النماذج الخاضعة للإشراف مناسبة لعينة تتضمن متغيرًا نحاول التنبؤ به وغالبًا ما يُطلق عليه اسم التصنيف.
  • وبالنسبة للمشكلات الخاضعة للإشراف يمكن حساب الخطأ عن طريق أخذ الفرق بين تسميات العينة والتسميات المتوقعة للنموذج ويُشار إلى هذا باسم “المتبقي” وهو أساس العديد من المقاييس المستخدمة لتقييم جودة النموذج.
  • النماذج غير الخاضعة للإشراف مناسبة لعينة لا تتضمن تسمية وتهدف إلى تجميع الملاحظات بناءً على أوجه التشابه في بياناتها ولهذا السبب لا يمكن حساب المتبقي.

3- التقسيم

  • عندما يتم ملائمة نموذج مع العينة فإنّه يتم تقدير العلاقات في البيانات باستعمال صيغة لحل قيمة (أي معاملات الانحدار) أو من خلال الصقل التكراري (أي الأوزان في شبكة عصبية أو عتبة احتمالية)، ويتم تقدير نوعين من العناصر هي المعلمات والمعلمات الفائقة.
  • المعلمات هي عناصر نموذجية بحكم تطبيق النموذج ويتم تعلمها من تلقاء نفسها وعادةً ما يتم تهيئة المعلمات إلى قيمة عشوائية أو شبه عشوائية ويتم تحديثها أثناء التدريب عن طريق تحسين وظيفة الهدف.
  • المعلمات الفائقة هي عناصر نموذجية يتم تحديثها يدويًا لتحسين وظيفة الهدف نفسها المستخدمة لتقدير المعلمات، أو مقياس بديل ويشار إلى هذه العملية باسم “الضبط”.

شارك المقالة: