تحليل البيانات الاستكشافية (EDA) هو مصطلح يدل على فئات محددة من التحليل الأساسي والنتائج التي يتم الوصول إليها باستخدام مجموعات البيانات عادةً ما تكون في وقت مبكر من عملية التحليل.
ما هي العلاقة بين تحليل البيانات الاستكشافية وتصور البيانات
يُعد تصور البيانات مكونًا مهمًا في تحليل البيانات الاستكشافية (EDA) لأنّه يسمح لمحلل البيانات “بإلقاء نظرة على” بياناتهم والتعرف على المتغيرات والعلاقات بينهم، ومن أجل اختيار تصور البيانات وتصميمه من المهم مراعاة شيئين:
- السؤال الذي تريد الإجابة عليه (وكم عدد المتغيرات التي يتضمنها هذا السؤال)؟
- البيانات المتوفرة، (هل هي كمية أم تنبؤية)؟
كما يشمل نظام التصور القائم على تحليل البيانات الاستكشافية على وحدة إدخال لتلقي البيانات الضخمة الرسمية أو غير النمطية ومحلل بيانات لتحليل البيانات الصحيحة، وفقًا لإعداد المستخدم بين إدخال البيانات الضخمة بواسطة وحدة الإدخال ومعالج التصور الذي تم تكوينه لتقليل وتصور البيانات الصالحة التي تم تحليلها وفقًا لخيار الإعداد المسبق، ووحدة إخراج للوصول إلى واجهة مستخدم رسومية (GUI) لتلقي أو تحديد معلومات الإعداد أو خيارات الإعداد من المستخدم.
ووحدة تحكم مهيأة للتحكم في التشغيل الكلي لوحدة الإدخال ومحلل البيانات ومعالج التصور ووحدة الإخراج، وعند النظر إلى تقنيات تصور المعرفة من خلال تصور الأنماط العديدة التي تخلقها البيانات، يشير تصور البيانات إلى استخدام الوسائل المرئية لفهم نتائج تحليل البيانات بسهولة.
كما يقدم معلومات في البيانات من خلال المخططات والصور والرسوم البيانية الإحصائية، كما أنّ الكثير من البيانات يجب أن يتم إنشاؤها بواسطة محترف يعرف العمل لأنّه يحتاج إلى تمثيل في صورة واحدة أو صورتين، ولكن قد يميل محترفو الأعمال إلى استنتاج النتائج المرجوة مقدمًا وغالبًا ما يفشلون في تحقيق نتائج موضوعية، وكلما أمكن يتم استخدم أداة تصور موضوعية.