المبادئ الأساسية لتحليل البيانات الاستكشافية

اقرأ في هذا المقال


يأخذ تحليل البيانات الاستكشافية في الاعتبار ما الذي تبحث عنه وكيفية البحث عنه وكيفية تفسير ما نكتشفه، حيث في جوهرها إنّ (EDA) هي أكثر من كونها عملية تدريجية.

ما هي المبادئ الأساسية لتحليل البيانات الاستكشافية

يميل استكشاف البيانات إلى الكشف عن طبيعتها الأساسية بسهولة أكبر بكثير من وضع افتراضات حول القواعد التي نعتقد (أو نريد) الالتزام بها، ومن حيث تحليلات البيانات يمكن القول عمومًا أن تحليل البيانات الاستكشافية هو التأكد النوعي وليس كميًا وهذا يعني أنّه يتضمن النظر إلى الصفات المتأصلة في مجموعة البيانات بعقلية فضولية، وعادةً لا يحاول إجراء قياسات باردة أو استخلاص رؤى حول محتوى مجموعة البيانات.

يُقترح أحيانًا تحليل البيانات الاستكشافية (EDA) كنهج لتحديد الفرضية، حيث غالبًا ما اعتماده على هذا النحو في حل المشكلات ويتكون من تحليل بيانات الرصد والتي يتم جمعها غالبًا بدون فرضيات محددة جيدًا، بهدف إيجاد أدلة يمكن أن تلهم الأفكار والفرضيات:

  • عرض البيانات.
  • تحديد السمات البارزة.
  • تفسير السمات البارزة.

تحليل البيانات الاستكشافية (EDA) هو تقليد إحصائي راسخ يوفر أدوات مفاهيمية وحسابية لاكتشاف الأنماط لتعزيز تطوير الفرضيات وصقلها، وتكمل هذه الأدوات والمواقف استخدام اختبارات الدلالة والفرضية المستخدمة في تحليل البيانات التأكيدية (CDA)، وعلى الرغم من أنّ (EDA) تكمل (CDA) بدلاً من استبدالها إلّا أنّ استخدام (CDA) بدون (EDA) نادرًا ما يكون مضمونًا.

حتى عندما يتم الاحتفاظ بنظريات محددة جيدًا تساعد (EDA) المرء على تفسير نتائج (CDA) وقد تكشف عن أنماط غير متوقعة أو مضللة في البيانات، وإنّ تحليل البيانات الاستكشافية (EDA) هو الخطوة الثالثة من دورة حياة علم البيانات حيث يعمل على تلخيص البيانات وتصورها وتحويلها من أجل فهمها بشكل أعمق، وعلى وجه الخصوص من خلال (EDA) يتم تحديد المشكلات المحتملة في البيانات ونكتشف الاتجاهات التي توفر مزيدًا من التحليلات.


شارك المقالة: