ما هو التنقيب عن البيانات الوصفية

اقرأ في هذا المقال


البيانات الوصفية هي معلومات وصفية تتعلق بالبيانات الفعلية، والإضافة إلى هذه البيانات الوصفية القياسية هناك بيانات وصفية موسعة تمثل نطاقًا أكبر وتحتوي عادةً على مجموعة متنوعة من المعلومات التفصيلية في عملية التنقيب عن البيانات.

ما المقصود بالتنقيب عن البيانات الوصفية

  • يحتوي كل تنسيق ملف على مقدار مختلف من البيانات الوصفية الممتدة، حيث غالبًا ما تظل هذه البيانات الوصفية الإضافية أو الموسعة مخفية وبالتالي غير مستخدمة، نظرًا لأن القراءة المنهجية والاستخدام غير ممكن تقنيًا وصعبًا يدويًا فقط أو بجهد كبير.
  • يعني التنقيب في البيانات الوصفية قراءة ومعالجة كمية كبيرة من البيانات الوصفية “المخفية” في تنسيقات الملفات المختلفة.
  • يُعد تتبع استخدام البيانات عبر العديد من المشاريع والفرق التي تستخدم تطبيقات أو أطر عمل مختلفة تحديًا، ويمكن لأنظمة التخزين الحديثة تبسيط التتبع والإبلاغ عن استخدام البيانات من خلال الاستفادة من البيانات الوصفية.
  • البيانات الوصفية هي البيانات المتعلقة بالبيانات المستخدمة والتي يمكنها تتبع السمات مثل وقت آخر تعديل لجزء من البيانات وبواسطة عملية التنقيب عن البيانات الوصفية.
  • تُعد البيانات الوصفية القابلة للتوسيع التي تضيف تسمية البيانات المخصصة شائعة في تخزين الكائنات ومتاحة في بعض أنظمة الملفات الموزعة.
  • يمكن استخدام البيانات الوصفية لتتبع مصدر البيانات وإضافة الملصقات وحتى بيانات العلامات المستخدمة لنماذج الذكاء الاصطناعي المختلفة.
  • هناك تقنية ناشئة في هذا المجال تستخدم أدوات إدارة البيانات أو حلول إدارة البيانات الوصفية لأتمتة وضع علامات على البيانات وفهرستها التي تستخدم واجهات برمجة التطبيقات والتي تغطي أنواعًا مختلفة من التخزين.
  • في أبسط أشكالها إنّ تنقيب البيانات الوصفية هي سياق المعلومات، حيث يتم استخدامه لوصف البيانات وإثراء المحتوى بمعلومات مفيدة لأنّها تساعد المؤسسات على اكتشاف المحتوى على مستوى المؤسسة واستخدامه وإدارته.
  • كما إنّ تنقيب البيانات الوصفية يتيح كميات ذات مغزى للمحتوى وتضمن وصولاً أسرع إلى المحتوى الدقيق المنتشر عبر المستودعات.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: