ما هو تسلسل البيانات في عملية التنقيب

اقرأ في هذا المقال


يتم تعريف بيانات التسلسل في استخراج البيانات على أنّها بيانات تعتمد فيها النقاط في مجموعة البيانات على النقاط الأخرى في مجموعة البيانات، وتمثل كل نقطة ملاحظة في نقطة زمنية محددة.

ما هو تسلسل البيانات في عملية التنقيب

  • لقد أثبت التسلسل في التنقيب عن البيانات أنّه مفيد بالفعل في مجموعة متنوعة من المجالات بما في ذلك التسويق وتحليل تدفق النقر على الويب، وفي مشاكل التعرف على النشاط تُستخدم الطوابع الزمنية بشكل شائع لترتيب السلسلة.
  • الغرض من التنقيب التسلسلي هو العثور على أنماط مثيرة للاهتمام في البيانات بناءً على بعض التقييم الذاتي أو الموضوعي لمدى اهتمامه.
  • كما يستلزم هذا التخصيص عادةً إيجاد أنماط متسلسلة متكررة في مقياس دعم التردد في بيانات التسلسل في تنقيب البيانات.
  • يُعد اكتشاف جميع بيانات التسلسل المتكررة في التنقيب عن البيانات مهمة صعبة، ونظرًا لمساحة البحث الاندماجية والأسية قد يكون الأمر صعبًا إلى حد ما.
  • يتم نشر العديد من مناهج التنقيب المتسلسل في العقد الماضي والتي تستخدم أساليب الاستدلال المختلفة للتعامل مع البحث الأسي.
  • مجموعة بيانات السلاسل الزمنية هي مجموعة من قيم الأعداد الصحيحة التي تم جمعها خلال فترة زمنية ضمن بيانات التسلسل في التنقيب عن البيانات، حيث تؤخذ القيم عادةً على فترات منتظمة.
  • تستخدم في تطبيقات تحليل البيانات والإشارات في بيانات التسلسل في استخراج البيانات ويتم تصميم تحليل الانحدار لبيانات السلاسل الزمنية على نطاق واسع.
  • لتحديد بيانات السلاسل الزمنية يقوم تحليل الاتجاه بإنشاء نموذج متكامل باستخدام الجوانب أو الحركات الأربعة الأساسية في بيانات التسلسل في تنقيب البيانات.
  • تشكل سلسلة منظمة من العناصر أو الأحداث الموثقة مع أو بدون فكرة محددة عن الوقت تسلسلًا رمزيًا في تسلسل البيانات في تنقيب البيانات.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: