العلاقة بين تحليل البيانات الاستكشافية وتحليل البيانات

اقرأ في هذا المقال


يمكن الحصول على معرفة محددة من خلال تحليل البيانات الاستكشافية مثل إنشاء قائمة مرتبة بالعوامل ذات الصلة، وقد لا تقوم بالضرورة بتضمين جميع العناصر في تحليل البيانات، ويجب النظر إليها على أنها مبادئ توجيهية وليست قواعد صارمة.

ما هي العلاقة بين تحليل البيانات الاستكشافية وتحليل البيانات

تحليل البيانات الاستكشافية (EDA) هو أسلوب لتحليل البيانات، وغالبًا ما تكون الخطوة الأولى في تحليل البيانات ويتم تنفيذها قبل اعتماد أي تقنيات إحصائية رسمية وعلى الرغم من أنّه يمكن استخدام تقنيات إحصائية محددة، مثل إنشاء الرسوم البيانية أو المخططات الصندوقية، فإنّ (EDA) ليست مجموعة من التقنيات أو الإجراءات.

يصف كتيب الإحصاء الهندسي تحليل البيانات الاستكشافية بأنها “فلسفة”، حيث يعتبر البعض تحليل البيانات الاستكشافية شكلاً من أشكال الفن أكثر من كونه علمًا، ويُعد تحليل البيانات الاستكشافية مكملاً للإحصاءات الاستنتاجية والتي تميل إلى أن تكون صارمة إلى حد ما مع القواعد والصيغ.

تتضمن (EDA) المحلل الذي يحاول الحصول على “شعور” بمجموعة البيانات وغالبًا ما يستخدم حكمه الخاص لتحديد العناصر الأكثر أهمية في مجموعة البيانات، وعلى سبيل المثال القياس متعدد الأبعاد عبارة عن (EDA) يستخدم التمثيلات المرئية للمسافات أو أوجه التشابه بين مجموعات من الكائنات، الأمر متروك للمستخدم لتفسير بالضبط ما تمثله المسافات، وتقوم العلاقة بين تحليل البيانات وتحليل البيانات الاستكشافية في:

  • التحقق من البيانات المفقودة والأخطاء الأخرى.
  • اكتساب أقصى قدر من التبصر في مجموعة البيانات وهيكلها الأساسي.
  • اكتشاف نموذجًا شحيحًا وهو نموذج يشرح البيانات بأقل عدد من متغيرات التوقع.
  • التحقق من الافتراضات المرتبطة بأي نموذج مناسب أو اختبار فرضية.
  • العمل على إنشاء قائمة بالقيم المتطرفة أو غيرها من الحالات الشاذة.
  • البحث عن تقديرات المعلمات وفترات الثقة المرتبطة بها أو هوامش الخطأ.
  • تحديد المتغيرات الأكثر تأثيراً.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: