ما المقصود بعملية جدولة البيانات

اقرأ في هذا المقال


لإجراء التحليل الإحصائي يتم جمع أنواع مختلفة من البيانات بواسطة المحقق أو المحلل، حيث عادةً ما تكون المعلومات التي يتم جمعها في شكل خام ويصعب تحليلها، ولجعل التحليل مفيدًا وسهلاً يتم تحويل البيانات الأولية أو تصنيفها إلى فئات مختلفة بناءً على خصائصها، ويُعرف تجميع البيانات هذا في فئات مختلفة ذات خصائص متشابهة أو متجانسة باسم “جدولة البيانات”، ويُعرف كل قسم أو فئة من البيانات المجمعة بالفئة، والأسس المختلفة لتصنيفات المعلومات الإحصائية هي الجغرافية والتسلسل الزمني والنوعي البسيط والمتنوع والكمي أو العددي.

ما هي عملية جدولة البيانات

جدولة البيانات: هو العرض المجدول للبيانات وهو أحد تقنيات عرض البيانات، حيث يعني العرض الجدولي ترتيب البيانات التي تم جمعها في مجموعة منظمة في صفوف وفي أعمدة، ويُعرف الترتيب الأفقي للبيانات بالصفوف بينما يسمى الترتيب الرأسي بالأعمدة ويتم تسجيل الحقائق المصنفة في صفوف وأعمدة لإعطاء شكل جدولي.

لتحليل البيانات التي تم جمعها من الضروري تقديمها بطريقة يسهل فهمها وتفسيرها، والطرق المختلفة التي يمكن من خلالها تقديم البيانات المصنفة، هي عرض نصي وجدولي وتخطيطي ورسمي، والعرض التقديمي الجدولي أو الجدولة هي طريقة منهجية لتقديم البيانات الرقمية في صفوف وأعمدة، حيث يساعد العرض التقديمي المحقق في تبسيط العرض وتسهيل التحليل وكما يمكن أن تجعل المعلومات ذات الصلة قريبة من بعضها البعض، بحيث يمكن للمحقق بسهولة إجراء مقارنات بينها وكما يساعد في مزيد من التحليل الإحصائي وتفسير البيانات.

أهمية عملية جدولة البيانات

1- العرض المنهجي للبيانات

بشكل عام تكون البيانات المجمعة في شكل مجزأ، ويتم تقديم كتلة البيانات بطريقة موجزة وبسيطة عن طريق الجداول الإحصائية، وبالتالي فإنّ الجدولة تساعد في تقديم البيانات بطريقة منظمة.

2- سهولة مقارنة البيانات

إذا كانت البيانات في شكلها الأولي فمن الصعب للغاية مقارنتها، والمقارنة ممكنة عندما يتم تقديم عناصر البيانات ذات الصلة في شكل بسيط وموجز، ويسهل عرض البيانات الكاملة وغير المنظمة في شكل جداول مقارنة الجوانب المختلفة للبيانات.

3- تحديد القيم المرغوبة

في الجدولة يتم تقديم البيانات بطريقة منظمة من خلال ترتيبها في صفوف وأعمدة، لذلك يمكن تحديد القيم المرغوبة دون صعوبة كبيرة وفي حالة عدم وجود بيانات مجدولة سيكون من الصعب تحديد القيم المطلوبة.

4- توفير أساس للتحليل

  • يوفر عرض البيانات في شكل جدول أساسًا لتحليل هذه البيانات، بحيث تشير المنهجية الإحصائية إلى أن التحليل يتبع عرض البيانات.
  • يُعد العرض المنهجي للبيانات في شكل جدول شرطًا أساسيًا لتحليل البيانات، وتُعد الجداول الإحصائية أدوات مساعدة مفيدة في التحليل.

5- تحديد النمط العام للبيانات

من خلال تقديم البيانات في شكل مكثف في مكان واحد يعرض العرض الجدولي اتجاه البيانات، ومن خلال النظر إلى جدول إحصائي يمكن تحديد النمط العام للبيانات.

خصائص عملية جدولة البيانات

  • تسهل المقارنة عن طريق تقريب المعلومات ذات الصلة من بعضها البعض وتساعد بشكل أكبر في البحث الإحصائي والتفسير.
  • الجدولة هي طريقة لترتيب أو تنظيم البيانات في شكل جدول، وقد تكون عملية الجدولة بسيطة أو معقدة حسب نوع التصنيف.
  • من خلال الجدولة يمكن تنفيذ البيانات يدويًا أو بمساعدة الكمبيوتر، حيث في الغالب يعتمد تنفيذ جدولة البيانات على تكلفة الدراسة ونوعها وحجمها وتوافر أجهزة الكمبيوتر والوقت الذي يتم التخلص منه ومثل هذه العوامل الأخرى.
  • إذا تم تنفيذ الجدولة على جهاز كمبيوتر يتم تحويل الإجابات في شكل رقمي، بينما في حالة الجدولة يدويًا يمكن للمرء استخدام طرق القوائم والتحصيل والفرز والعدد.

أنواع جدولة البيانات

1- جدولة بسيطة أو جدولة أحادية الاتجاه

عندما يتم جدولة البيانات الموجودة في الجدول إلى خاصية واحدة يُطلق عليها “جدولة بسيطة” أو “جدولة أحادية الاتجاه”، وعلى سبيل المثال يتم تصنيف جدولة البيانات لجميع سكان العالم وفقًا لخاصية واحدة مثل الجنس.

2- جدولة مزدوجة أو جدولة ثنائية الاتجاه

عندما يتم جدولة البيانات في الجدول مع الأخذ في الاعتبار خاصيتين مختلفتين في وقت واحد وكما يتم تعريفها على أنّها جدولة مزدوجة أو جدولة ثنائية الاتجاه، وعلى سبيل المثال يتم تصنيف جدولة البيانات لجميع سكان العالم حسب خاصيتين مختلفتين مثل الدين والجنس.

3- جدولة معقدة

عندما يتم جدولة البيانات الموجودة في الجدول وفقًا للعديد من الخصائص يشار إليها على أنّها جدولة معقدة، وعلى سبيل المثال يتم تصنيف جدولة البيانات لجميع الناس في العالم حسب ثلاث خصائص أو أكثر مثل: الجنس ومعرفة القراءة والكتابة.

إنّ الجدولة تنجح في تصنيف البيانات في علم البيانات، وهذا يعني أنّ العرض المجدول للبيانات يمكن أن يتم فقط عندما يتم تصنيفها إلى فئات مختلفة، ويتضمن العرض الجدولي للبيانات ترتيب البيانات المصنفة في صفوف وأعمدة ذات رؤوس وعناوين فرعية مناسبة وإنّ العرض المجدول للبيانات هو طريقة لعرض البيانات.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First Edition


شارك المقالة: