عيوب عملية تنظيف البيانات

اقرأ في هذا المقال


يمكن أن تواجه حلول عملية تنظيف البيانات العديد من المشكلات أثناء عملية تنقية البيانات وتحتاج إلى فهم المشاكل المختلفة ومعرفة كيفية معالجتها.

ما هي عيوب عملية تنظيف البيانات

  • قد يخسر المحللون رؤى قابلة للتنفيذ بسبب البيانات غير الكاملة وهذا شائع جدًا في الحالات التي يتم فيها إسقاط الملاحظات والقيم المتطرفة المفقودة.
  • قد يؤدي إلى مشكلة أكبر عند التشغيل الآلي، وبعض أدوات تنظيف البيانات الآلية ليست ذكية جدًا وقد ينتهي بها الأمر إلى إساءة التعامل مع بعض الملاحظات في مجموعة البيانات.
  • وهو مضيعة للوقت وقد يستغرق تنظيف البيانات الكثير من الوقت خاصة عند التعامل مع البيانات الكبيرة وهذه العملية مكلفة للغاية.

تحديات عملية تنظيف البيانات

1- البيانات ليست ثابتة أبدًا

  • من المهم أن تقوم عملية تنظيف البيانات بترتيب البيانات بحيث يسهل الوصول إليها لكل من يحتاج إليها ويجب أن يحتوي المستودع على بيانات موحدة وليس بطريقة مبعثرة.
  • يجب أن يحتوي مستودع البيانات على نظام موثق يساعد الموظفين في الوصول بسهولة إلى البيانات من مصادر مختلفة.
  • يساعد تنظيف البيانات أيضًا على تحسين جودة البيانات عن طريق إزالة البيانات غير الدقيقة وكذلك الإدخالات الفاسدة والمكررة.

2- تؤدي البيانات غير الصحيحة إلى قرارات سيئة

  • أثناء تشغيل العمل فإنّه يتم الاعتماد على مصدر معين للبيانات بناءً على الاتخاذ لمعظم قرارات العمل وإذا كانت البيانات تحتوي على الكثير من الأخطاء، فقد تكون القرارات التي تتخذها غير صحيحة وتثبت أنّها خطرة على العمل.

3- تؤثر البيانات غير الصحيحة على سجلات العميل

  • سجلات العميل الكاملة ممكنة فقط عندما تتطابق الأسماء والعناوين ويمكن أن تكون أسماء وعناوين العميل مصادر ضعيفة للبيانات.
  • لتجنب هذه الأخطاء، يجب على الشركات توفير مراجع خارجية قادرة على التحقق من البيانات واستكمال نقاط البيانات وتصحيح أي تناقضات.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: