أنواع جداول البيانات وأهداف الجدولة

اقرأ في هذا المقال


الجدولة هي طريقة لتلخيص البيانات وتقديمها بطريقة منظمة في صفوف وأعمدة بناءً على خصائص معينة، وبكلمات بسيطة هو عرض جدولي للبيانات، كما يساعد في إجراء مقارنة بين الكيانات المختلفة ويساعد أيضًا في مزيد من التحليل الإحصائي والتفسير، وإنّها قائمة منطقية للبيانات الكمية ذات الصلة في الأعمدة (الرأسية) والصفوف (الأفقية) وذلك لتمكين تصنيف البيانات وتسهيل الدراسة المقارنة.

أنواع جداول البيانات

أولاً: بناءً على مدى التغطية

1- الجدول البسيط

يُطلق عليه أيضًا الجدول أحادي الاتجاه أو جدول الترتيب الأول، وهو أبسط شكل للجداول وفي مثل هذا الجدول تشتمل البيانات على خاصية واحدة فقط للمتغير.

2- الجدول المعقد

يُعرف أيضًا بالجدول المتشعب، حيث في هذه الجداول تشتمل البيانات على سمتين أو أكثر من خصائص المتغير ويمكن أن يكون من نوعين:

  • جدول ذو اتجاهين: حيث في هذا الجدول يتم تقسيم المتغير قيد الدراسة إلى مجموعتين وبناءً على اثنين من خصائصه المترابطة.
  • الجدول ثلاثي الاتجاهات: وفي هذا الجدول يتم تقسيم المتغير قيد البحث إلى ثلاث مجموعات اعتمادًا على ثلاثة من خصائصه المترابطة.

3- الجدول المصنف عبر المدخلات

تسمى الجداول التي يتم فيها تصنيف الإدخالات في كلا الاتجاهين من حيث الصفوف وكذلك من حيث الأعمدة بالجداول المصنفة عبر التصنيف، حيث بطريقتا التصنيف يمكن لكل فئة من تصنيف واحد أن تحدث مع أي فئة أخرى ويمكن إعداد هذه الجداول لخصائص متعددة أيضًا وتستخدم هذه الجداول لغرض التحليل.

ثانياً: بناءً على الهدف

1- عام أو جدول مرجعي

  • في مثل هذا الجدول يتم عرض المعلومات المادية في شكل مفصل، بحيث يمكن استخدامها لغرض الرجوع إلى نفس الموضوع.
  • عادةً ما يكون حجم هذه الجداول كبيرًا ويوجد في الملحق كمرجع والبيانات الواردة من مختلف الوزارات والوكالات الحكومية والهيئات المستقلة والمتعلقة بالسكان والتوظيف والإنفاق العام وما إلى ذلك هي أمثلة كلاسيكية لهذه الجداول.

2- جدول الملخص

  • يسمى بخلاف ذلك جدول الأغراض الخاصة أو جدول النص أو الجدول التحليلي.
  • يقدم البيانات المرتبطة بمشاكل محددة.
  • هذه الجداول أصغر من الجداول المرجعية.
  • يساعد في تحديد العلاقة وسط خصائص مختلفة.

ثالثاً: بناءً على طبيعة البيانات

1- الجدول الأصلي

تعرف أيضًا بجداول التصنيف، وهي تشمل البيانات التي تم جمعها من المصدر الأساسي أي في شكلها الأصلي، وجدول بيانات السلاسل الزمنية هو مثال على الجدول الأصلي.

2- الجدول المشتق

عندما يتم اشتقاق الجدول من جدول آخر ويطلق عليه الجدول المشتق، ويعرض أرقامًا مثل: الإجماليات والنسب المئوية والمتوسطات والنسب وما إلى ذلك، وجدول قيم الاتجاه المحسوبة من بيانات السلاسل الزمنية هو مثال على جدول مشتق.

ما هي أهداف جدولة البيانات

1- تبسيط البيانات المعقدة

عندما يتم جدولة أي معلومات، يتم ضغط حجم البيانات الخام وتقديمها بطريقة أكثر بساطة، وهذا يسهل فهم وتحليل البيانات المعقدة سابقًا، وتعمل جدولة البيانات على تحويل المعلومات المربكة إلى صيغة مفهومة لذلك يتم تبسط جدولة البيانات المعقدة عن طريق ترتيبها بشكل منهجي بطريقة هادفة، وبمعنى آخر تقلل البيانات المقدمة في مثل هذا التنسيق الجزء الأكبر من المعلومات أي أنّها تبسط البيانات الأولية في شكل أكثر محدودية ودقة يمكن أن يستوعبه الشخص العادي بسهولة في وقت أقل.

2- توفير معلومات مهمة

يؤدي تمثيل أي بيانات في شكل جدول إلى زيادة نطاق إبراز المعلومات المهمة، وذلك نظرًا لأنّ البيانات يتم تقديمها بطريقة موجزة دون أي تفسير نصي فإنّ أي معلومات مهمة يتم تمييزها تلقائيًا دون صعوبة، ويعد تحليل الجدولة المتقاطعة ضروريًا لاختبار الفرضيات والاحتمالات في التحليل الإحصائي، كما يتم تصميم الجدولة المتقاطعة لعرض البيانات في جدول ممّا يجعل قراءة هذه البيانات وتفسيرها أسهل بكثير.

الأحداث المستقلة التي تحتوي على خصائص محددة بشكل مستقل يتم جدولتها أو تنظيمها في جدول للطوارئ، ويتم إنشاء نموذج بناءً على قوانين الاحتمالات لتحديد قيم الخلية إذا كانت المتغيرات الفريدة مستقلة، كما يمكن بعد ذلك قياس الارتباط بين المتغيرات أو مقارنته أو اختباره مقابل القيم المتوقعة، وعلى الرغم من أنّ هذه التقنية تبدو وكأنها تكمن فقط في مجال الاستكشاف العلمي عالي المستوى، إلّا أنّها في الواقع أحد أصول الأعمال الواقعية التي تساعد في تحقيق الأهداف المستهدفة مثل تجزئة السوق أو رسم خرائط الطريق التنظيمي.

3- تمكين المقارنة بسهولة

عندما يتم تقديم البيانات بطريقة منظمة في صفوف وأعمدة يصبح من السهل المقارنة بينها على أساس العديد من المعلمات وعلى سبيل المثال يصبح من الأسهل تحديد الشهر الذي تتلقى فيه الدولة أقصى كمية من الأمطار، وإذا تم تقديم البيانات في جدول وخلاف ذلك يبقى هناك دائمًا مجال لارتكاب خطأ في معالجة البيانات بشكل صحيح، وتساعد جدولة البيانات في مقارنة مجموعات مختلفة من السلاسل، حيث عندما يتم عرض البيانات بترتيب منتظم في صفوف وأعمدة يصبح من الواضح إجراء مقارنة الكمية على أساس العديد من المعلمات.

4- المساعدة في التحليل الإحصائي للبيانات والتفسير وتقديم المراجع

يتضمن التحليل الإحصائي ارتباطًا حسابيًا ومتوسطًا وتشتتًا وما إلى ذلك من البيانات، حيث عندما يتم تقديم المعلومات بطريقة منظمة في جدول يصبح التحليل الإحصائي أكثر بساطة، كما يمكن أيضًا أن تكون جدولة البيانات بمثابة مصدر مرجعي، حيث يمكن استخدامها في بحث مختلف ودراسات أخرى.

5- العمل على توفير المساحة والوقت والمال

  • يسهل تصور البيانات أو العثور عليها بشكل موثوق عندما تكون في تنسيق جدول بدلاً من بنية نصية، ويمكن تكثيف كمية هائلة من المعلومات بشكل منهجي في جدول واحد، لذلك فهي توفر المساحة والوقت والمال أيضًا.
  • على الرغم من أنّه قد لا يبدو مهمًا مثل الهدف الآخر للجدولة إلّا أنّ توفير مساحة دون إهمال بجودة البيانات يمكن أن يكون مفيدًا للغاية على المدى الطويل، وبالإضافة إلى ذلك يساعد الجدول في تقديم الحقائق بطريقة أكثر إيجازًا من صفحة بعد صفحة من النص.

6- الإشارة إلى الاتجاه ونمط البيانات

الخصائص المختلفة لأي ظاهرة يمكن فيها بسهولة تحديد متوسط ​​القيم وتشتتها وانحرافها وما إلى ذلك إذا كان اتجاه ونمط البيانات المتعلقة بالظاهرة معروفين، حيث يشير جدول البيانات إلى اتجاه ونمط البيانات ومن ثم لتسليط الضوء على اتجاه ونمط البيانات يتم اللجوء إلى جدولتها كعملية أساسية.

7- تسهيل المراجع

في أي دراسة يتم فيها استخدام البيانات الثانوية من الضروري الإشارة إلى المصدر الذي تم الحصول منه على نفس البيانات من جدول مرقّم بشكل صحيح، وبالتالي لتسهيل مراجع البيانات في الدراسة المستقبلية يتم جدولة البيانات بشكل منهجي.

8- تسهيل حساب العوامل المختلفة

لتحليل البيانات وتفسيرها بشكل صحيح، هناك عوامل مختلفة مثل: المتوسط ​​والتشتت وانحراف القيم والارتباط وما إلى ذلك ويتم حساب كل هذه الحسابات التي تبسط إحصاء العوامل المختلفة ويتم إجراء جدولة البيانات بشكل صحيح.

9- كشف الأخطاء

في عملية جمع البيانات قد تتسلل أخطاء مختلفة في الحذف والعمولات، ولا يمكن اكتشاف هذه الأخطاء بسهولة ما لم يتم جدولة البيانات بشكل صحيح، وبالتالي لاكتشاف الأخطاء إن وجدت وفي البيانات المجمعة يتم إجراء الجدولة كخطوة لاختبار دقة البيانات.

تساعد الجدولة في جعل البيانات أكثر وضوحًا وملاءمة للتحليل الإحصائي في علم البيانات، كما أنّها تساعد في إبراز الخصائص الرئيسية للبيانات بشكل مبسط وأيضاً يمكن الكشف عن الأخطاء بسهولة، والجدولة هي عملية تقديم البيانات المجمعة والمصنفة بترتيب مناسب وبطريقة منهجية في الأعمدة والصفوف بحيث يمكن مقارنتها بسهولة وتوضيح خصائصها.

المصدر: Introducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: