كيفية تقييم جودة البيانات

اقرأ في هذا المقال


يتم توفير نهج منظم قائم على الأعمال لقياس جودة البيانات وتقييمها باستخدام أبعاد جودة البيانات لضمان الملاءمة للغرض وتحديد أهداف وعتبات الجودة.

كيفية تقييم جودة البيانات

يعتمد إجراء تقييم جودة البيانات على توقعات الجودة المحددة مسبقًا والمعايير التي وضعها أصحاب المصلحة والمعتمدة ويُنصح بالبدء بقياس جودة البيانات لمجموعة صغيرة من السمات الرئيسية، ويعد تحديد ملفات تعريف البيانات هو الخطوة الأولى الموصى بها.

تتمثل الآلية الأكثر فاعلية لمساعدة الأعمال في تقييم جودة البيانات ووضع أهداف وعتبات ومقاييس مفيدة في النظر في أبعاد جودة البيانات وتطبيقها على كل سمة و”البعد” هو المعيار الذي يتم على أساسه قياس جودة البيانات، كما يمكن قياس عدد من الأبعاد المختلفة للجودة ويتم عرض مجموعة العينات المستخدمة:

  • إمكانية الوصول، بحيث تكون البيانات متاحة عند الحاجة.
  • الدقة، أي التقارب مع القصد الأصلي والصدق بالمقارنة مع مصدر موثوق والارتباط بين عناصر البيانات ودقة القياس.
  • الاكتمال بحيث توافر سمات البيانات المطلوبة.
  • التغطية وتوفر سجلات البيانات المطلوبة.
  • التوافق أي مواءمة المحتوى مع المعايير المطلوبة.
  • الاتساق أي الامتثال للأنماط المطلوبة وقواعد التوحيد مدعومًا بمعايير إدخال البيانات وإدارة سير العمل ومعايير التصميم الفني.
  • النزاهة، وهي دقة علاقات البيانات.
  • حسن التوقيت وعملية المحتوى.
  • التفرد، حيث يمكن تحديد كل سجل بشكل لا لبس فيه ويشمل التفرد أيضًا عمليات التحقق من تكرار السجلات.
  • بمجرد تحديد المعايير وتقييم البيانات يمكن تطوير المقاييس ونشرها في شكل بطاقة أداء أو لوحة معلومات، وتسهل نتائج التقييم تحليل السبب الجذري وهي مدخلات رئيسية في خطط تحسين جودة البيانات الخاصة بالمنظمة.
  • يجب إجراء تقييمات دورية لتحديد ما إذا كان يتم الوفاء بالعتبات والأهداف المقبولة، ويجب تحديث المقاييس وفقًا لذلك ولدعم هذه الجهود وتتبع التحسينات بمرور الوقت من المفيد إجراء تحليل تأثير لجهود جودة البيانات الشاملة.
  • بالإضافة إلى التأثيرات المحددة للتحسينات المتعلقة بعناصر البيانات الفردية كجزء من عملية التقييم، يساعد تصنيف تأثيرات جودة البيانات الرديئة في تحديد أولويات خطط تنقية البيانات وتحسين الجودة.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: