معالجة البيانات الجدولية في علم البيانات

اقرأ في هذا المقال


يميل تحليل البيانات إلى تضمين تحليل المستندات النصية وتنظم مجموعات البيانات الجدولية البيانات التي يمكن الوصول إليها آليًا “الأرقام والسلاسل” في سلسلة من السجلات.

ما هي معالجة البيانات الجدولية

  • يقترن كل سجل بعدد ثابت من الحقول وغالبًا ما يتم عرض مجموعات البيانات المجدولة في برنامج جداول بيانات، وتوجد معلومات التنسيق في جداول البيانات وملفات البيانات المجدولة المتوفرة على بوابات البيانات المفتوحة.
  • ولا يوجد أحيانًا ما يشير إلى أنّه يمكن تعيين مجموعات البيانات هذه أو تحليلها باستخدام برامج ولكن إذا كنت تعرف ما للبحث عن هذه الأنواع من مجموعات البيانات وكيفية معالجتها ليس من الصعب جدًا تحويلها إلى تنسيقات مختلفة.
  • يتم تحديد مجموعة من الفئات المستخدمة لتنظيم البيانات في أول جزء جدولي ويتم تحليل بنية الفئات ويتم رسم استنتاج حول البيانات الموجودة في الخلية الأولى في الجزء الجدولي الأول بناءً على موضع الخلية الأولى في الهيكل.
  • يولد التحويل أول نموذج سردي دون استخدام قالب لجملة سردية وحيث يتضمن التحويل تحديد أهمية الخلية الأولى بالنسبة إلى البيانات المجدولة الأولى بناءً على موضع الخلية الأولى في الهيكل.
  • إنّ البيانات الجدولية تتطلب معالجة أو معالجة متخصصة لتفسير البيانات الجدولية بشكل صحيح وكامل، بحيث تتضمن الجداول القيم الموجودة في خلايا الجدول التي يمكن الرجوع إليها باستخدام موضع الخلية وصف العمود في الجدول.
  • ومع ذلك فإنّ مجرد تعلم قيمة الخلية أو قراءتها أو تفسيرها بمعزل عن غيرها لا يكفي لفهم أهمية قيمة الخلية وبدون معرفة العلاقة بين قيمة الخلية والبنية التنظيمية للجدول الذي تظهر فيه لا يمكن للمرء أن يفهم معنى قيمة الخلية تلك.
  • وغالبًا ما تتجاهل محركات البرمجة اللغوية المتاحة حاليًا البيانات المجدولة عند معالجة المستندات التي تتضمن بيانات مجدولة.
  • وتُعد معرفة الهيكل الجدولي المعني والاستنتاجات التي يمكن استخلاصها من موقع البيانات داخل هذا الهيكل والإحالة المرجعية مع المحتوى الآخر في المستند بعض الأمثلة على الميزات الضرورية للتفسير الصحيح أو الكامل للجدول بيانات.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: