معايير تقنية البيانات المهيكلة في علم البيانات

اقرأ في هذا المقال


تحتاج البيانات المهيكلة إلى نموذج بيانات ومستودع والذي يكون عادةً مجموعات من البيانات، وينظم نموذج البيانات عناصر البيانات ويحدد كيفية ارتباطها ببعضها البعض.

ما هي معايير تقنية البيانات المهيكلة

  • قد يحدد نموذج البيانات أنّ عنصر البيانات الذي يمثل العميل في مخزن البيانات ويحتوي على العديد من العناصر أو السمات الأصغر التي تمثل معلومات محددة للعميل.
  • قد يتم فرض هيكل البيانات وعلى سبيل المثال قد يقبل حقل الرمز البريدي فقط البيانات الرقمية المكونة من خمسة أحرف.
  • يحافظ هذا على تكامل البيانات مع منع إدخال البيانات التي لا تتناسب مع هذا الوصف في المخطط وتتمثل طبيعة البيانات المنظمة في إمكانية تجميعها منطقيًا حسب القيم والقيود المتشابهة.
  • يتم تعريف البيانات بشكل ضيق من خلال هذه القيود ويتم كتابتها في فترات زمنية محددة في مستودع البيانات، ويكون كل حقل في السجل منفصلاً ويمكن استرداد معلوماته إمّا بمفردها أو مع بيانات من حقول أخرى وفي مجموعة متنوعة.
  • يمكن أيضاً حفظ البيانات المهيكلة في مخازن البيانات العلائقية والتي تربط جداول البيانات مع بعضها بحيث يمكن الاستفادة منها بواسطة مجموعة أوسع من معايير البحث لإرجاع معلومات أكثر تفصيلاً.
  • البيانات المهيكلة هي لبنة أساسية في اقتصاد المعلومات ولكن يساء فهمها على نطاق واسع، ويحدث سوء الفهم بسبب تطبيق مفهوم البيانات المهيكلة على طريقتين مختلفتين، ولكن لا تقل أهمية عنهما لإنشاء ونشر وصيانة المعلومات في العالم الحديث للتجارة المتصلة.
  • يمكن تعريف البيانات المهيكلة على أنّها مفردات خاضعة للرقابة ومنظمة بشكل هرمي تستخدم لوصف وتصنيف الكيانات وسواء كانت مقالات إخبارية أو منتجات وخدمات الشركة.
  • البيانات المنظمة كطريقة لتحسين المعلومات ليست جديدة ومنذ عام (1873م) أحدث نموذج بيانات منظم يسمى “نظام ديوي العشري” ثورة في المكتبات من خلال اقتراح تنظيم الكتب بالنسبة للموضوع بدلاً من وقت الحصول عليها.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: