ما هي عملية التنقيب عن البيانات المكانية والزمانية

اقرأ في هذا المقال


المكان يعني الفضاء وفي حين أنّ الزمن يعني الوقت، ويشير التنقيب عن البيانات المكانية إلى عملية استخراج المعرفة والعلاقات المكانية والأنماط المثيرة التي لا يتم تخزينها بشكل صريح في قاعدة بيانات مكانية، ومن ناحية أخرى يشير التنقيب في البيانات الزمنية إلى استخراج المعرفة حول حدوث حدث ما وسواء أكان يتبع تغيرًا عشوائيًا أو دوريًا أو موسميًا.

ما هي البيانات المكانية

تُعرف البيانات التي توفر معلومات حول منطقة جغرافية أو موقع مخصص باسم “البيانات المكانية”، حيث يوفر المعلومات التي تساعد في تحديد موقع الميزة أو حدود الأرض، وعلاوةً على ذلك يمكن معالجة البيانات المكانية باستخدام نظام المعلومات الجغرافية (GIS) أو حزم معالجة الصور.

1- أنواع البيانات المكانية

  • بيانات الميزة: تتبع بيانات الميزة نموذج بيانات المتجه وهي تمثل كيان العالم الحقيقي أي الطرق والأشجار والمباني وما إلى ذلك، يمكن تمثيل هذه المعلومات بصريًا في شكل نقطة أو خط أو مضلع.
  • بيانات التغطية: تتبع بيانات التغطية نموذج البيانات النقطية، حيث تحتوي بيانات التغطية على تعيين البيانات المستمرة في الفضاء ويتم تمثيلها كمجموعة من القيم في صورة القمر الصناعي، ونموذج السطح الرقمي والصور الجوية وما إلى ذلك ويكون التمثيل المرئي لبيانات التغطية في شكل شبكة أو شبكة غير منتظمة مثلثة.

2- ما هو التنقيب عن البيانات المكانية

التنقيب عن البيانات المكانية هو عملية اكتشاف أنماط مثيرة للاهتمام ومفيدة والعلاقات المكانية والتي لم يتم تخزينها مسبقًا في قواعد البيانات المكانية، وفي البيانات المكانية يستخدم محللو التنقيب عن المعلومات الجغرافية أو المكانية لإنتاج ذكاء الأعمال أو نتائج أخرى، حيث تشمل التحديات التي ينطوي عليها التنقيب عن البيانات المكانية تحديد الأنماط أو العثور على كائنات ذات صلة بمشروع البحث.

يجب أن تحتوي البيانات المكانية على خطوط طول أو عرض أو اتجاه شرق أو شمال (UTM)، أو بعض الإحداثيات الأخرى التي تشير إلى موقع نقطة في الفضاء، وأبعد من ذلك يمكن أن تتضمن البيانات المكانية على أي عدد من السمات المتعلقة بالمكان ويمكن اختيار أنواع السمات التي تريدها لوصف المكان، كما توفر مواقع الويب الحكومية مصدرًا من خلال تقديم بيانات مكانية ولكن لا يلزم أن تقتصر على ما أنتجته.

يمكن جعل أي بيانات مكانية إذا كان من الممكن ربطها بموقع ما ويمكن للمرء أيضًا أن يكون لديه بيانات زمانية مكانية مرتبطة بالمواقع في كل من المكان والزمان، وعلى سبيل المثال عند تحديد الموقع الجغرافي للتغريدات من (Twitter) في أعقاب حدث ما قد يتم إنشاء رسم متحرك يوضح انتشار التغريدات من مركز الحدث.

الأدوات العامة المستخدمة لتنقيب البيانات المكانية هي: (Clementine See5 / C5.0) و(Enterprise Miner)، وهذه الأدوات مفضلة لتحليل البيانات العلمية والهندسية والبيانات الفلكية وبيانات الوسائط المتعددة والبيانات الجينومية وبيانات الويب، ويجب أن تحتوي البيانات المكانية على:

  • معلومات خطوط الطول والعرض (UTM) شرقًا أو شمالًا.
  • تشير الإحداثيات الأخرى إلى موقع نقطة في الفضاء ممّا يساعد في تحديد الموقع، بصرف النظر عن هذه المعلومات قد تحتوي على أنواع مختلفة من السمة التي تساعد في تحديد الموقع الجغرافي وخصائصه.

ما هي البيانات الزمانية

البيانات الزمنية هي البيانات التي تمثل حالة في الوقت المناسب، حيث أنّها في الأساس بيانات مؤقتة صالحة لفترة زمنية محددة، كما يتم جمع البيانات في وقت معين لتحليل أنماط الطقس ومراقبة حركة المرور ودراسة التركيبة السكانية وما إلى ذلك والبيانات الزمنية مفيدة لتحليل التغيير الذي يحدث خلال فترة زمنية، حيث  يتم استخدام هذا التحليل لاحقًا لتحديد السبب المحتمل للتغييرات وبالتالي التوصل إلى حلول.

1- ما هو التنقيب في البيانات الزمانية

التنقيب في البيانات الزمنية هو عملية الوصول إلى معلومات مفيدة من مجموعة البيانات الزمنية، حيث يهتم بتحليل البيانات الزمنية لاستخراج وإيجاد الأساليب والانتظام الزمني في مجموعات البيانات، والمهام المختلفة لتنقيب البيانات المؤقتة هي كما يلي:

  • توصيف البيانات ومقارنتها.
  • التحليل العنقودي.
  • قواعد الرابطة.
  • التنبؤ وتحليل الاتجاهات.
  • تحليل النمط.

الهدف الرئيسي من التنقيب في البيانات الزمنية هو العثور على الأنماط الزمنية والاتجاهات والعلاقات داخل البيانات واستخراج معلومات ذات مغزى من البيانات لتصور كيف تغير اتجاه البيانات على مدار الوقت، ويتضمن التنقيب في البيانات الزمنية معالجة بيانات السلاسل الزمنية وتسلسل البيانات لتحديد وحساب قيم نفس السمات عبر نقاط زمنية متعددة.

الاختلاف بين التنقيب عن البيانات المكانية والزمانية

1- المفهوم

التنقيب في البيانات المكانية هو استخراج المعلومات والعلاقات من البيانات الجغرافية المخزنة في قاعدة بيانات مكانية، أمّا التنقيب في البيانات الزمانية هو استخراج المعلومات من البيانات الزمنية لتحديد نمط البيانات.

2- نوع البيانات

يتعامل التنقيب في البيانات المكانية بشكل أساسي مع البيانات المكانية أي الموقع والبيانات ذات المرجعية الجغرافية وما إلى ذلك، أمّا عادةً ما يتعامل التنقيب في البيانات المؤقتة مع المحتوى المؤقت من تجمع البيانات.

3- المنطق الأساسي

يحتاج التنقيب عن البيانات المكانية إلى معلومات فضائية داخل البيانات، وعلى سبيل المثال يمكن معاملة أي بيانات مع إحداثيات الموقع كمجموعة بيانات مكانية، بالمقابل يحتاج التنقيب في البيانات الزمنية إلى معلومات الوقت وعلى سبيل المثال يمكن معاملة أي مجموعة بيانات تحتوي على الأحداث بمرور الوقت على أنّها بيانات زمنية.

4- مبدأ العمل

يعتمد التنقيب عن البيانات المكانية على قواعد مثل: قواعد الارتباط والقواعد التمييزية والقواعد المميزة وما إلى ذلك، بالمقابل يعتمد التنقيب في البيانات الزمانية على إيجاد أنماط في البيانات عن طريق التجميع والارتباط والتنبؤ ومقارنة البيانات، وتشمل البيانات الزمانية المكانية التمثيلات المكانية والزمانية، وهي تشمل ثلاثة أنواع متميزة من السمات وهي السمات غير الزمانية المكانية والسمات المكانية والزمانية.

تمثل السمات غير الزمانية المكانية ميزات غير سياقية للكائنات وتحدد السمات المكانية مواقع ونطاقات وأشكال الكائنات، كما أنّ السمات الزمنية هي أساليب زمنية ومدد عمليات تشير إلى كائن مكاني (متجه) أو حقل (طبقات نقطية)، كما يمكن أيضًا تصنيف أنواع البيانات الزمانية المكانية بناءً على طبيعة جمعها إلى ملاحظات منفصلة أو مستمرة، والأحداث ومسارات البيانات هي أمثلة لأنواع البيانات المنفصلة الزمانية المكانية، بينما تتضمن أنواع البيانات المستمرة بيانات مرجعية نقطية وبيانات نقطية.

5- أمثلة

يتمثل المثال الأساسي لتنقيب البيانات المكانية في تحديد النقطة الساخنة لأي حدث أو مواقع غير عادية، والاستخدام الأساسي لتنقيب البيانات الزمنية، هو فهم تغيرات الطقس على مدار فترة زمنية أو في مقارنة التغيرات المناخية على أساس الطقس اليوم مقابل عشر سنوات في اليوم نفسه، وكما أنّ التنقيب في البيانات الزمنية هو تحليل لبيانات السلاسل الزمنية لالتقاط سلوك البيانات مقابل فترة زمنية.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: