كيفية عمل خط أنابيب البيانات

اقرأ في هذا المقال


ينقل خط أنابيب البيانات البيانات بين الأنظمة، حيث تتضمن خطوط أنابيب البيانات سلسلة من خطوات معالجة البيانات لنقل البيانات، وقد تتضمن هذه الخطوات نسخ البيانات وتوحيدها وضمها مع مصادر البيانات.

مبدأ عمل خط أنابيب البيانات

  • يتطلب نقل البيانات بين الأنظمة العديد من الخطوات من نسخ البيانات إلى نقلها من موقع محلي إلى السحابة إلى إعادة تنسيقها أو ضمها إلى مصادر البيانات الأخرى.
  • يجب القيام بكل خطوة من هذه الخطوات وعادة ما تتطلب برنامجًا منفصلاً، وخط أنابيب البيانات هو مجموع كل هذه الخطوات وتتمثل مهمته في ضمان حدوث هذه الخطوات بشكل موثوق لجميع البيانات.
  • يجب أن تكون هذه العمليات تلقائية لكن معظم المؤسسات تحتاج إلى مهندس واحد أو اثنين على الأقل لصيانة الأنظمة وإصلاح الأعطال والتحديث وفقًا للاحتياجات المتغيرة للأعمال.
  • تعني التحولات الآلية العديدة المطلوبة لخطوط أنابيب بيانات فعالة وشاملة أنه حتى مع التخطيط الدقيق ستبدأ الأنابيب عاجلاً أم آجلاً في التسرب.
  • تستلزم العمليات الشاملة خط أنابيب للبيانات والأجزاء والعمليات الأساسية لمعظم خطوط أنابيب البيانات هي مصادر، والتي يتم الوصول إلى البيانات من مصادر مختلفة.
  • عند الوصول إلى البيانات يجب مراعاة ضوابط الأمان ويجب اتباع أفضل الممارسات لتحقيق الأداء الأمثل والموثوقية، ويتم جمع مخطط البيانات وإحصائيات البيانات حول المصدر لتسهيل تصميم خط الأنابيب.
  • يعمل خط أنابيب البيانات على ضم ودمج البيانات من مصادر مختلفة كجزء من خط أنابيب البيانات، حيث تحدد الصلات المنطق والمعايير الخاصة بكيفية دمج البيانات.
  • كما تتم عملية التوحيد على أساس كل حقل على حدة وقد تحتاج البيانات إلى أن تكون موحدة من حيث وحدات القياس والتواريخ والسمات مثل: اللون أو الحجم والرموز المتعلقة بمعايير الصناعة.
  • ويتم تصحيح البيانات والأخطاء، بحيث قد تكون هذه الحقول غير صالحة مثل: اختصار حالة أو رمز بريدي غير موجود أو اختصارات تحتاج إلى التوسيع وقد تكون هناك أيضًا سجلات تالفة تحتاج إلى إزالتها أو مراجعتها في عملية منفصلة.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: