أدوات عملية استكشاف البيانات

اقرأ في هذا المقال


إنّ استكشاف البيانات هو عملية تكرارية للكشف عن الرؤى المخفية في البيانات، حيث تُستخدم التطبيقات البرمجية للمخططات والبرمجة وجداول البيانات بشكل شائع لاستكشاف البيانات.

أهمية استخدام أدوات عملية استكشاف البيانات

  • إنّ أحد أدوات عملية استكشاف البيانات هي جداول البيانات، وهي برامج تسمح بإضافة أعمدة وصفوف من الأشكال لحساب الوسائل وإجراء تحليلات إحصائية وصفية.
  • يمكن استخدامها لتكوين ملخصات للنتائج وكذلك المخططات والرسوم البيانية لفهم العلاقات بين المتغيرات بشكل أفضل ويمكن عرضها بعدة طرق كالمخططات الشريطية والمخططات الخطية والمخططات الدائرية، وهي مجرد أمثلة قليلة على تصورات البيانات التي يمكن إنتاجها.
  • يتم تخزين البيانات في بعض الأحيان في مجموعات البيانات لسهولة الوصول إليها وللسماح بإنتاج ملخصات أو بيانات مجمعة أو تقارير، حيث يجب أن يكون برنامج مجموعات البيانات قادرًا على تخزين البيانات واسترجاعها وفرزها وتحليلها.
  • يمكن تطوير البرامج المتخصصة لتحرير وتنظيف وإسناد ومعالجة الناتج الجدولي النهائي، حيث إنهم يقدمون الخدمة الكاملة في وحدة واحدة ويمكن استخدامها في كل مرة يتم فيها إكمال الاستبيان نفسه وإدخاله في النظام.
  • ستنتج هذه البرامج نتائج جاهزة للنشر، وستُستخدم تطبيقات البرامج الإحصائية لمعالجة البيانات ولإنتاج الملخصات وتصورات البيانات ولكن يمكن أيضًا استخدامها لإجراء تحليلات إحصائية متقدمة مثل النمذجة.
  • أحد الأمثلة على أداة استكشاف البيانات الشائعة جدًا هو برمجية (R)، وهي لغة برمجة وبرامج مفتوحة المصدر يمكن لأي شخص تنزيلها وتثبيتها على أجهزة الكمبيوتر الشخصية الخاصة بهم لتحويل البيانات واستكشافها وتحليلها.
  • يتم إنشاء جميع المخططات والرسوم البيانية المعروضة في الأقسام التالية باستخدام (R)، ويمكن استخدام مخرجات الكمبيوتر التي تم الحصول عليها من أدوات استكشاف البيانات هذه بعدة طرق.
  • يمكن حفظها لاسترجاعها واستخدامها في المستقبل أو إرسالها إلى فرق أخرى في ملفات إلكترونية أو نشرها عبر الإنترنت لتوصيل المعلومات الإحصائية للمستخدمين.
  • عادةً ما تكون المخرجات محكومة بالحاجة إلى توصيل معلومات محددة إلى جمهور محدد.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: