تم اكتشاف تحليل البيانات الاستكشافية (EDA) في السبعينيات، وبالاقتران مع إمكانات التعرف على الأنماط الطبيعية التي يتم امتلاكها في تحليل البيانات الاستكشافية (EDA)، توفر الرسومات قوة لا مثيل لها لتنفيذ ذلك.
ما هي وظائف عملية تحليل البيانات الاستكشافية
- تتجاوز (EDA) النمذجة الرسمية أو الفرضية لإعطاء أقصى قدر من البصيرة لمجموعة البيانات وهيكلها وفي تحديد المتغيرات المؤثرة.
- يمكن أن يساعد أيضًا في اختيار تقنية تحليل البيانات الأكثر ملاءمة لمشروع معين، حيث يمكن أيضًا الحصول على معرفة محددة مثل إنشاء قائمة مرتبة بالعوامل ذات الصلة لاستخدامها كمبادئ توجيهية باستخدام (EDA).
- توفر أدوات تحليل البيانات الاستكشافية (EDA) فهمًا أفضل لمتغيرات البيانات وعلاقاتها، وهذا بدوره يساعد في تحديد كيفية معالجة البيانات للتحليل المعقد مثل تحديد خوارزمية التعلم الآلي واختيار الميزات، وإنشاء ميزات جديدة باستخدام المعرفة التجارية.
- كما أنّه يساعد أصحاب المصلحة على تأكيد ما إذا كانوا يطرحون الأسئلة الصحيحة أو ما إذا كانت البيانات مناسبة لمشكلة العمل أو الفرصة.
- تتمثل وظائف عملية تحليل البيانات الاستكشافية في الحصول على رؤى حول ملخص البيانات وتحديد الأنماط والكشف عن مشكلات جودة البيانات والارتباطات الموضعية وتسليط الضوء على القيم المتطرفة لتحليل دقيق.
- معظم تقنيات (EDA) رسومية بطبيعتها مع بعض التقنيات الكمية، ويعود سبب الاعتماد الكبير على الرسومات إلى أن الدور الرئيسي لـ (EDA) بطبيعته هو الاستكشاف بعقلية متفتحة، وتمنح الرسومات المحللين قوة لا مثيل لها للقيام بذلك وتحفيز البيانات على الكشف عن أسرارها الهيكلية، والاستعداد دائمًا لاكتساب نظرة ثاقبة جديدة، غير متوقعة في كثير من الأحيان حول البيانات.
- تكون الوظائف قابلة للتطبيق فقط على إطارات البيانات والبعض الآخر فقط للسلسلة وغيرها لكليهما، حيث في سياق (EDA) في الباندا يكون هناك عادةً كائن سلسلة كعمود فردي من إطار البيانات.