طريقة تحليل البيانات الاستكشافية للبيانات متعددة الأبعاد

اقرأ في هذا المقال


مع التطوير المستمر للتقنيات الجديدة مثل: الحوسبة السحابية والبيانات الضخمة ينتج كميات كبيرة من البيانات والتي تظهر تدريجيًا نموًا أسيًا، والبيانات متعددة الأبعاد هي نوع بيانات نموذجي في مجال تحليل ذكاء الأعمال اليوم.

مبدأ تحليل البيانات الاستكشافية للبيانات متعددة الأبعاد

عادةً ما يتم استكشاف البيانات متعددة الأبعاد يدويًا أو بواسطة بعض أدوات التنقيب عن البيانات لنوع معين من البيانات ممّا ينتج عنه نظرة ثاقبة، ومع ذلك غالبًا ما تكون مهام البصيرة هذه صعبة وتستغرق وقتًا طويلاً بسبب تعقيد تحليل البيانات متعدد الأبعاد ونقص أدوات التنقيب عن البيانات، مما يقلل بشكل كبير من قدرة المستخدم على التفاعل مع البيانات متعددة الأبعاد.

كما أنّ طريقة تحليل البيانات الاستكشافية للبيانات متعددة الأبعاد يمكن أن تحل محل التنقيب اليدوي عن البيانات والاستكشاف وتوفير الوقت والطاقة للمحللين، وكسر القيود والتوصية بذكاء بزاوية الرؤية والاتجاه عند مداخل تفاعلية مختلفة وذلك بمطابقة مشغلي خوارزمية الشجرة المتكاملة بذكاء، وحل المعضلة المتمثلة في صعوبة تحليل البيانات متعددة الأبعاد.

وكذلك توفير تكوين معلمة الخوارزمية الافتراضية في العملية بشكل كامل وتسهيل التحليل السريع وتحديد المواقع للمستخدمين الصغار والعاديين وتمكين المستخدمين المحترفين من الإخراج محتويات مخرجات الخوارزمية المخصصة، بحيث يكون التحليل أكثر كفاءة ويتم حل المشكلات التي توفرها تقنية الخلفية، وخطوات تحليل البيانات الاستكشافية للبيانات متعددة الأبعاد هي:

  • تلقي مجموعة بيانات متعددة الأبعاد.
  • إنشاء محتويات المخطط بذكاء وفقًا لمجموعة البيانات.
  • مطابقة خوارزمية الشجرة بذكاء وفقًا لمحتوى المخطط.
  • يختار المستخدم بنشاط خوارزمية الشجرة.
  • التقصير أو تعديل تكوين المعلمة لخوارزمية الشجرة المحددة.
  • تلقي البيانات والحساب بواسطة خوارزمية الشجرة، مما يؤدي إلى إنشاء نتيجة تقرير الخوارزمية.

كما يتم إنشاء محتويات الرسم التخطيطي بذكاء وفقًا لمجموعة البيانات، ويُنشئ النظام بذكاء محتويات الرسم البياني المناسبة وفقًا للأنواع المتغيرة لجميع المتغيرات الخاصة بمجموعة البيانات متعددة الأبعاد المستلمة، حيث تشتمل أنواع المتغيرات بشكل خاص على المتغيرات العددية ومتغيرات التصنيف، ويتم العثور على وحدات البيانات المهمة.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First Edition


شارك المقالة: