ما هي التحليلات التنبؤية في علم البيانات

اقرأ في هذا المقال


يمكن أن توفر تحليلات البيانات ممارسة فحص البيانات للإجابة على الأسئلة وتحديد الاتجاهات واستخراج الأفكار والمعلومات اللازمة لوضع الإستراتيجيات واتخاذ قرارات عمل مؤثرة، والقدرة على التنبؤ بالأحداث والاتجاهات المستقبلية أمر بالغ الأهمية وتظهر التحليلات التنبؤية في كثير من الأحيان أكثر مما قد تفترض من توقعات الطقس الأسبوعية إلى التطورات الطبية التي تدعم الخوارزميات.

ما المقصود بالتحليلات التنبؤية

التحليلات التنبؤية: هي استخدام البيانات للتنبؤ بالاتجاهات والإجراءات القادمة ويعتمد البيانات التاريخية للتنبؤ بالسيناريوهات المتوفرة التي يمكن أن تساعد في اتخاذ القرارات الإستراتيجية، كما يمكن أن تكون التوقعات للمستقبل القريب أو المستقبل البعيد مثل التنبؤ بالتدفقات النقدية للشركات للعام المقبل، كما يمكن إجراء التحليل التنبئي يدويًا أو باستخدام خوارزميات التعلم الآلي، وفي كلتا الحالتين يتم استخدام البيانات التاريخية لعمل افتراضات حول المستقبل.

خصائص التحليلات التنبؤية

الشركات اليوم تغمرها البيانات من ملفات السجل إلى الصور والفيديو وكل هذه البيانات موجودة في مستودعات بيانات متباينة عبر المؤسسة، ولاكتساب رؤى من هذه البيانات يستخدم علماء البيانات خوارزميات التعلم العميق والتعلم الآلي للعثور على الأنماط والتنبؤ بالأحداث المستقبلية، بحيث تتضمن بعض هذه التقنيات الإحصائية نماذج الانحدار اللوجستي والخطي والشبكات التلافيفية وأشجار القرار وتستخدم بعض تقنيات النمذجة هذه التعلم التنبؤي الأولي لعمل رؤى تنبؤية إضافية.

إحدى أدوات التحليلات التنبؤية هي تحليل الانحدار والتي يمكن أن تحدد العلاقة بين متغيرين (الانحدار الخطي الفردي) أو ثلاثة أو أكثر من المتغيرات (الانحدار المتعدد)، حيث تتم كتابة العلاقات بين المتغيرات كمعادلة رياضية يمكن أن تساعد في التنبؤ بالنتيجة في حالة تغيير متغير واحد، كما يمكن أن يمكّنك التنبؤ من اتخاذ قرارات أفضل وصياغة استراتيجيات مستنيرة بالبيانات.

أنواع النمذجة التنبؤية

1- نماذج التصنيف

تندرج نماذج التصنيف ضمن فرع نماذج التعلم الآلي الخاضعة للإشراف، بحيث تصنف هذه النماذج البيانات بناءً على البيانات التاريخية وتصف العلاقات ضمن مجموعة بيانات معينة، وعلى سبيل المثال يمكن استخدام هذا النموذج لتصنيف العملاء أو العملاء المحتملين إلى مجموعات لأغراض التجزئة.

بدلاً من ذلك يمكن استخدامه أيضًا للإجابة على الأسئلة ذات النواتج الثنائية مثل الإجابة بنعم أو لا أو صواب وخطأ وحالات الاستخدام الشائعة لهذا الغرض هي الكشف عن الاحتيال وتقييم مخاطر الائتمان، وتشمل أنواع نماذج التصنيف الانحدار اللوجستي وأشجار القرار والشبكات العصبية و(Naïve Bayes).

2- نماذج التجميع

تندرج نماذج التجميع تحت التعلم غير الخاضع للإشراف ويقومون بتجميع البيانات بناءً على سمات متشابهة، وعلى سبيل المثال يمكن لموقع التجارة الإلكترونية استخدام النموذج لفصل العملاء إلى مجموعات متشابهة بناءً على الميزات المشتركة، وتطوير استراتيجيات التسويق لكل مجموعة، وتتضمن خوارزميات التجميع الشائعة مجموعات (k-mean) وتجميع متوسط ​​التحول والتكتل المكاني القائم على الكثافة للتطبيقات مع الضوضاء (DBSCAN)، والتوقعات القصوى (EM) العنقودية باستخدام نماذج جمع غاوسي (GMM) والتكتل الهرمي.

3- نماذج السلاسل الزمنية

تستخدم نماذج السلاسل الزمنية مدخلات بيانات مختلفة بتردد زمني محدد مثل اليومي والأسبوعي والشهري وما إلى ذلك، من الشائع رسم المتغير التابع بمرور الوقت لتقييم البيانات الخاصة بالموسمية والاتجاهات والسلوك الدوري، ممّا قد يشير إلى الحاجة إلى تحويلات وأنواع نماذج معينة.

تُعد نماذج الانحدار التلقائي (AR) والمتوسط ​​المتحرك (MA) و(ARMA) و(ARIMA) جميعها نماذج متسلسلة زمنية تستخدم بشكل متكرر، ويمكن لمركز الاتصال استخدام نموذج السلاسل الزمنية للتنبؤ بعدد المكالمات التي سيتلقاها في الساعة في أوقات مختلفة من اليوم.

فوائد النمذجة التنبؤية

تتمتع المؤسسة التي تعرف ما يمكن توقعه استنادًا إلى الأنماط السابقة بميزة تجارية في إدارة المخزونات والقوى العاملة وحملات التسويق ومعظم جوانب العملية الأخرى.

1- أمان البيانات

يجب أن تهتم كل منظمة حديثة بالحفاظ على أمان البيانات، بحيث تعمل مجموعة من الأتمتة والتحليلات التنبؤية على تحسين الأمان، كما يمكن للأنماط المحددة المرتبطة بسلوك المستخدم النهائي المشبوه وغير المعتاد أن تؤدي إلى إجراءات أمنية محددة.

2- تقليل المخاطر

بالإضافة إلى الحفاظ على أمان البيانات تعمل معظم الشركات على تقليل ملفات تعريف المخاطر الخاصة بها، وعلى سبيل المثال يمكن للشركة التي تمد الائتمان استخدام تحليلات البيانات، لفهم ما إذا كان العميل يشكل مخاطر أعلى من المتوسط ​​في التخلف عن السداد وقد تستخدم الشركات الأخرى التحليلات التنبؤية لفهم ما إذا كانت التغطية التأمينية كافية.

3- الكفاءة التشغيلية

تُترجم تدفقات العمل الأكثر كفاءة إلى تحسين هوامش الربح.

4- تحسين عملية صنع القرار

إن إدارة أي عمل ينطوي على اتخاذ قرارات محسوبة، ويتطلب أي توسع أو إضافة لخط إنتاج أو أي شكل آخر من أشكال النمو موازنة المخاطر الكامنة مع النتيجة المحتملة، كما يمكن أن توفر التحليلات التنبؤية نظرة مهمة لإبلاغ عملية صنع القرار وتقديم ميزة تنافسية.

الهدف من التحليلات التنبؤية

التحليلات التنبؤية هي شكل من أشكال التحليلات المتقدمة ويتضمن تطبيق تقنيات التحليل الإحصائي واستعلامات البيانات وخوارزميات التعلم الآلي على مجموعات البيانات لإنشاء نماذج تنبؤية تضع قيمة رقمية أو درجة على احتمال حدوث إجراء أو حدث معين.

التحليلات التنبؤية هي تخصص رئيسي في مجال تحليلات البيانات وهو مصطلح شامل لاستخدام الأساليب الكمية ومعرفة الخبراء لاشتقاق المعنى من البيانات، والإجابة على الأسئلة الأساسية حول الأعمال التجارية والطقس والرعاية الصحية والبحث العلمي ومجالات أخرى من الاستفسار، وفي سياق الأعمال التركيز الرئيسي غالبًا ما يشار إلى هذه العملية باسم تحليلات الأعمال.

ما هي استخدامات التحليلات التنبؤية

يُعد التنبؤ بالطقس أحد أشهر استخدامات النمذجة التنبؤية وتُستخدم التحليلات التنبؤية أيضًا للتنبؤ بالانتخابات والتنبؤ بانتشار الأمراض ونمذجة آثار تغير المناخ، وفي مجال الأعمال التجارية تساعد النمذجة التنبؤية الشركات على تحسين العمليات وتحسين رضا العملاء وإدارة الميزانيات وتحديد أسواق جديدة وتوقع تأثير الأحداث الخارجية، وتطوير منتجات جديدة وتحديد استراتيجيات الأعمال والتسويق والتسعير.

تشمل تطبيقات الأعمال للتحليلات التنبؤية استهداف الإعلانات عبر الإنترنت وتحليل سلوك العملاء لتحديد أنماط الشراء والإبلاغ عن المعاملات المالية الاحتيالية المحتملة، وتحديد المرضى المعرضين لخطر تطوير حالات طبية معينة واكتشاف أعطال وشيكة في أجزاء المعدات الصناعية قبل حدوثها، وتستخدم وول ستريت النمذجة التنبؤية لاختيار الأسهم والاستثمارات الأخرى.

كما لوحظ أن صناعة التسويق من أبرز الجهات التي تتبنى التحليلات التنبؤية جنبًا إلى جنب مع محرك البحث الكبير ومقدمي الخدمات عبر الإنترنت، حيث تشمل الصناعات الأخرى التي تعد مستخدمًا كبيرًا للتحليلات التنبؤية الرعاية الصحية والتصنيع.

أدوات التحليلات التنبؤية

يتم استخدام مجموعة واسعة من الأدوات في النمذجة والتحليلات التنبؤية، وتقدم (AWS) و(Google) و(IBM) و(Microsoft) و(SAP) و(SAS Institute)، والعديد من بائعي البرامج الآخرين أدوات تحليلات تنبؤية وتقنيات ذات صلة تدعم التعلم الآلي وتطبيقات التعلم العميق، بالإضافة إلى ذلك تلعب البرامج مفتوحة المصدر دورًا كبيرًا في سوق التحليلات التنبؤية.

تُستخدم تحليلات لغة (R) مفتوحة المصدر بشكل شائع في تطبيقات التحليلات التنبؤية مثل لغتي البرمجة (Python) و(Scala) وتتوفر أيضًا العديد من التحليلات التنبؤية مفتوحة المصدر ومنصات التعلم الآلي، بما في ذلك مكتبة من الخوارزميات المضمنة في محرك معالجة (Spark).

يمكن لفرق التحليلات استخدام الإصدارات الأساسية مفتوحة المصدر من (R) ولغات التحليلات الأخرى أو الدفع مقابل الإصدارات التجارية التي يقدمها البائعون مثل (Microsoft)، وقد تكون الأدوات التجارية باهظة الثمن ولكنّها تأتي بدعم فني من البائع وعلى العكس من ذلك يجب على مستخدمي إصدارات مفتوحة المصدر خالصة استكشاف الأخطاء وإصلاحها بأنفسهم، أو طلب المساعدة من خلال مواقع دعم المجتمع مفتوحة المصدر.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First Edition


شارك المقالة: