ما هي عملية تصفية البيانات

اقرأ في هذا المقال


تصفية البيانات هي عملية اختيار جزء أصغر من مجموعة البيانات الخاصة واستعمال تلك المجموعة الفرعية للعرض أو التحليل والتصفية بشكل عام مؤقتة ويتم الاحتفاظ بمجموعة البيانات الكاملة ولكن يتم استخدام جزء منها فقط للحساب.

كيف تتم عملية تصفية البيانات

  • يمكن استخدام التصفية من أجل النظر إلى النتائج لفترة زمنية معينة وحساب النتائج لمجموعات معينة من الاهتمامات واستبعاد الملاحظات الخاطئة أو “السيئة” من التحليل.
  • تتطلب التصفية تحديد قاعدة أو منطق لتحديد الحالات التي تريد تضمينها في تحليلك، ويمكن أيضًا الإشارة إلى التصفية على أنّها بيانات “فرعية” أو “بحث”.
  • تصفية البيانات هي عملية التأكد من مجموعة البيانات لاستبعاد البيانات أو إعادة ترتيبها أو تقسيمها وفقًا لمعايير معينة وغالبًا ما يستخدم متخصصو تكنولوجيا المعلومات تصفية البيانات؛ لإنهاء مسؤولياتهم ومساعدة الآخرين داخل مؤسستهم في فحص البيانات.
  • تصفية البيانات هي مهمة تقليل محتوى الضوضاء أو الأخطاء من بيانات العملية المقاسة، وإنّها مهمة ضرورية لأنّ ضوضاء القياس تحجب الميزات المهمة في البيانات وتحد من فائدتها في الممارسة.
  • بتم تطوير تقنيات مختلفة لتصفية بيانات العملية وتشمل التقنيات الخالية من النماذج والتقنيات القائمة على النماذج والتقنيات القائمة على النماذج التجريبية.
  • وباستعمال وظيفة التصفية الجديدة يمكن الآن تصفية البيانات بشكل ديناميكي، وهذه الوظيفة مفيدة جدًا لتنظيف البيانات وكذلك التحليل.
  • تتيح ميزة التصفية تحديد البيانات التي سيتم عرضها في الجداول أو الرسوم البيانية وتقييدها، وعلى سبيل المثال يسمح عامل التصفية الموجود في الصفحة “الرئيسية” بالحصول على البيانات.
  • يمكن أن يعني مصطلح عامل التصفية مجموعة متنوعة من الأشياء واعتمادًا على التكنولوجيا أو الانضباط الفني المعني.
  • في تطبيقات الكمبيوتر تُعد عملية تصفية البيانات برنامجًا أو قسمًا من التعليمات البرمجية مصممًا لفحص كل طلب إدخال أو إخراج لمعايير تأهيل معينة ثم معالجته أو إعادة توجيهه وفقًا لذلك.
  • عملية تصفية البيانات عبارة عن كود مرور يأخذ بيانات الإدخال ويتخذ بعض القرارات المحددة بشأنه وربما يحولها ويمررها إلى برنامج آخر في نوع من خطوط الأنابيب.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: