ما هي خصائص عملية تحليل البيانات الاستكشافية

اقرأ في هذا المقال


يمكن أن تتضمن عملية تحليل البيانات الاستكشافية (EDA) تنفيذ مهام محددة لتفسير نتائج هذه المهام وهو المكان الذي تكمن فيه المهارة الحقيقية، حيث يتم اعتماد مهارات أساسية لإجراء تحليل البيانات الاستكشافية.

خصائص عملية تحليل البيانات الاستكشافية

1- حساب أهم المتغيرات

عند إجراء أي تحليل للبيانات من الضروري تحديد أهمية المتغيرات المتنوعة، وهذا يشمل كيفية ارتباطهم ببعضهم البعض وعلى سبيل المثال ما هي المتغيرات المستقلة التي تؤثر على المتغيرات التابعة، بحيث سيساعد تحديد هذا في وقت مبكر على استخراج المعلومات الأكثر فائدة لاحقًا.

2- إنشاء النموذج الأكثر كفاءة

عند إجراء التحليل الكامل سيكون هناك حاجة إلى إزالة أي معلومات دخيلة، وهذا لأنّ البيانات الإضافية غير الضرورية يمكن أن تحرف النتائج أو ببساطة تحجب الرؤى الرئيسية بضوضاء غير ضرورية، ولتحقيق الهدف يجب تضمين أقل عدد من المتغيرات الضرورية، و(EDA) تساعد في تحديد المعلومات التي يمكن استخراجها.

3- تحديد هوامش الخطأ

إنّ عملية تحليل البيانات الاستكشافية ليست مجرد معلومات مفيدة، حيث يتعلق الأمر أيضًا بتحديد البيانات التي قد تؤدي إلى أخطاء لا يمكن تجنبها في تحليلك اللاحق، كما تساعد معرفة البيانات التي ستؤثر على النتائج على تجنب القبول الخاطئ للاستنتاجات الخاطئة أو تصنيف نتيجة بشكل غير صحيح على أنهّا ذات دلالة إحصائية عندما لا تكون كذلك.

4- تحديد أنسب الأدوات الإحصائية للمساعدة

ربما تكون النتيجة العملية لـ (EDA) هي أنّها ستساعد على تحديد التقنيات والنماذج الإحصائية التي ستساعدك في الحصول على ما تحتاجه من مجموعة البيانات الخاصة بك، وعلى سبيل المثال هل هناك حاجة إلى إجراء تحليل تنبؤي أو تحليل للمشاعر وسوف تساعد (EDA) على اتخاذ القرار، كما يمكن التعرف على أنواع مختلفة من تحليل البيانات وغالبًا ما يرسم الرؤى باستخدام التصورات على سبيل المثال الرسوم البيانية والمؤامرات، وهو مهم لاكتشاف الأخطاء وفحص الافتراضات وتحديد العلاقات بين المتغيرات واختيار أدوات نمذجة البيانات الصحيحة.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: