كيفية استخدام الشبكات العصبية في عملية تنقيب البيانات

اقرأ في هذا المقال


نظرًا لأنّه تنمو التكنولوجيا يومًا بعد يوم ويتم إنتاج كمية كبيرة من البيانات كل ثانية، فإنّ تحليل البيانات سيكون مهمًا للغاية لأنّه يساعد في اكتشاف الاحتيال وتحديد البريد الإلكتروني العشوائي، لذلك ظهر التنقيب عن البيانات للمساعدة في العثور على الأنماط المخفية واكتشاف المعرفة من مجموعات البيانات الكبيرة.

ما هي الشبكة العصبية Neural Networks

الشبكة العصبية: هي نموذج لمعالجة المعلومات مستوحى من الجهاز العصبي البشري، وكما هو الحال في الجهاز العصبي البشري هناك خلايا عصبية بيولوجية بنفس الطريقة في الشبكات العصبية وتمتلك خلايا عصبية اصطناعية وهي وظيفة رياضية تنشأ من الخلايا العصبية البيولوجية.

باستخدام الشبكات العصبونية يمكن لمؤسسات تخزين البيانات استخراج المعلومات من مجموعات البيانات لمساعدة المستخدمين على اتخاذ قرارات أكثر استنارة، حيث يتم تحقيق ذلك من خلال قدرة الشبكة العصبونية على التعامل مع العلاقات المعقدة والدمج المتبادل للبيانات والتعلم الآلي، ويمكن للشبكات العصبونية وتقنيات الذكاء الاصطناعي تنفيذ العديد من الأغراض التجارية باستخدام بيانات غير منظمة.

وهذا بدءًا من تتبع الاتصالات في الوقت الفعلي وتوثيقها إلى العثور على عملاء جدد يقومون بأتمتة عمليات المتابعة والإبلاغ عن العملاء المتوقعين، كما تم تطبيق الشبكات العصبية بنجاح في مجموعة واسعة من تطبيقات التعلم الخاضعة للإشراف وغير الخاضعة للإشراف، حيث لا تُستخدم أساليب الشبكة العصبية بشكل شائع في مهام التنقيب عن البيانات، لأنّها غالبًا ما تنتج نماذج غير مفهومة وتتطلب أوقات تدريب طويلة.

تدرك الشركات الآن أن البيانات التي تمتلكها تستطيع أن تساعدها في توفير المعلومات عندما يتعلق الأمر باتخاذ القرار، بحيث تستفيد الشركات من الشبكات العصبونية للاستفادة من فوائد تدفقات البيانات، وتمتلك الشبكات العصبية الاصطناعية القدرة على تعلم ونمذجة العلاقات غير الخطية وعلى عكس تقنيات التنبؤ الأخرى فإنّه لا يفرض قيودًا على متغيرات الإدخال.

ما هي بنية الشبكة العصبية

أصبحت الشبكات العصبية أدوات قياسية ومهمة لاستخراج البيانات، وفي حين أنّ هناك العديد من بنى الشبكات العصبية المختلفة التي تم إنشاؤها من قبل الباحثين؛ فإنّ أكثر التطبيقات نجاحًا في الشبكات العصبونية للتنقيب عن البيانات كانت شبكات تغذية متعددة الطبقات، وهذه هي الشبكات التي توجد فيها طبقة إدخال تتكون من العقد التي تقبل ببساطة قيم الإدخال والطبقات المتتالية من العقد، والتي هي خلايا عصبية.

كما أنّ مخرجات الشبكات العصبية في طبقة ما، هي مدخلات إلى الخلايا العصبية في الطبقة اللاحقة، والطبقة الأخيرة تسمى “طبقة النواتج” وتُعرف الطبقات بين طبقات الإدخال والإخراج بـ “الطبقات غير الظاهرة”، وكما يوجد هناك نوعان من التعلم الخاضع للإشراف أحدهما هو الانحدار والآخر هو التصنيف، لذلك في مشكلة نوع الانحدار تُستخدم الشبكة العصبونية للتنبؤ بكمية عددية ويوجد خلية عصبونية واحدة في طبقة الإخراج ويكون ناتجها هو التنبؤ.

بينما من ناحية أخرى في مشكلة نوع التصنيف تحتوي طبقة المخرجات على العديد من العقد مثل عدد الفئات وتعطي عقدة طبقة المخرجات مع أكبر قيم المخرجات تقدير الشبكة للفئة لمدخل معين، وفي حالة خاصة من فئتين من الشائع وجود عقدة واحدة فقط في طبقة المخرجات، ويتم التصنيف بين الفئتين من خلال تطبيق حد على قيمة الإخراج في العقدة.

الشبكات العصبية هي عبارة عن مجريات مجربة من حيث أنها تعدل نفسها أثناء التعلم سواء من تدريبهم الأولي النشط أو من التعلم الذاتي المستمر الذي يواجهونه من خلال معالجة معلومات إضافية، ونموذج التعلم البسيط الذي تطبقه الشبكات العصبية يتضمن ترجيح تدفقات المدخلات وفقًا لذلك سيكون من المرجح أن يكون دقيقًا، ثم يتم إعطاء الأفضلية لتدفقات الإدخال ذات الوزن الأعلى لأنّ هذه لها تأثير أكبر وستقلل بشكل شبه مؤكد الأخطاء التي يمكن التنبؤ بها من خلال الوزن، ويتم ذلك من خلال خوارزميات النسب المتدرجة.

لماذا يتم استخدام طريقة الشبكة العصبية في التنقيب عن البيانات

تساعد الشبكات العصبية في التنقيب عن كميات كبيرة من البيانات في قطاعات مختلفة مثل: التجزئة والمصرفية (كشف الاحتيال) والمعلوماتية الحيوية (تسلسل الجينوم) وما إلى ذلك، كما يُعد العثور على معلومات مفيدة للبيانات الكبيرة المخفية أمرًا صعبًا وضروريًا للغاية أيضًا، بحيث يستخدم التنقيب عن البيانات الشبكات العصبية لجمع المعلومات من مجموعات البيانات الكبيرة من مؤسسات تخزين البيانات ممّا يساعد المستخدم في اتخاذ القرار، وفيما يلي بعض تطبيقات الشبكة العصبية في التنقيب عن البيانات:

  • كشف الاحتيال: إن المحتالين كانوا يستغلون الشركات والبنوك لتحقيق مكاسب مالية خاصة بهم على مدار السنوات الماضية وستزداد المشكلة في عالم اليوم الحديث بسبب تقدم التكنولوجيا، ممّا يجعل الاحتيال أمرًا سهلاً نسبيًا ولكن من ناحية أخرى وتساعد التكنولوجيا أيضًا في الكشف عن الاحتيال وفي هذه الشبكة العصبية كثيرًا في اكتشاف الاحتيال.
  • الرعاية الصحية: بالنسبة للرعاية الصحية، تساعد الشبكة العصبية في تشخيص الأمراض، حيث نعلم أن هناك العديد من الأمراض وهناك مجموعات بيانات كبيرة بها سجلات لهذه الأمراض باعتماد الشبكات العصبية وهذه السجلات، ولذلك تم تشخيص هذه الأمراض في مرحلة مبكرة في أسرع وقت ممكن.

طرق الشبكة العصبونية المختلفة في التنقيب عن البيانات

تُستخدم طريقة الشبكة العصبية في التصنيف والتجميع وتنقيب السمات والتنبؤ والتعرف على الأنماط، حيث تُعتبر طريقة (McCulloch-Pitts) أول شبكة عصبية، وقاعدة التعلم (Hebbian) هي واحدة من أقدم وأبسط قواعد التعلم للشبكة العصبية وكما يمكن تجزئة نموذج الشبكة العصبية على نطاق واسع إلى الأنواع الثلاثة التالية:

1- الشبكات العصبية Feed-Forward

في شبكة (Feed-Forward)، إذا كان لا يمكن تتبع قيم المخرجات إلى قيم الإدخال وإذا تم حساب عقدة الإخراج لكل عقدة إدخال فسيكون هناك تدفق أمامي للمعلومات ولا توجد ردود فعل بين الطبقات، حيث بكلمات بسيطة تتحرك المعلومات في اتجاه واحد فقط (للأمام) من عقد الإدخال عبر العقد غير الظاهرة وإلى عقد الإخراج، كما يُعرف هذا النوع من الشبكات باسم “شبكة التغذية الأمامية”.

2- شبكة التغذية الراجعة العصبية

يمكن للإشارات أن تنتقل في كلا الاتجاهين في شبكة التغذية الراجعة، حيث تعتبر الشبكات العصبية للتغذية الراجعة قوية للغاية ويمكن أن تصبح معقدة للغاية وكما أنّ شبكات التغذية الراجعة ديناميكية، بحيث تتغير “الحالات” في مثل هذه الشبكة باستمرار حتى يتم الوصول إلى نقطة التوازن.

كما يبقى في حالة توازن حتى يتغير المدخل ويحتاج إلى إيجاد توازن جديد، بحيث تُعرف أيضًا بنيات الشبكة العصبية للتغذية الراجعة بأنّها تفاعلية أو متكررة، أمّا حلقات التغذية الراجعة مسموح بها في مثل هذه الشبكات بحيث يتم استخدامها لمحتوى الذاكرة عنونة.

3- الشبكة العصبية للتنظيم الذاتي

الشبكة العصبية ذاتية التنظيم (SONN) هي نوع من الشبكات العصبية الاصطناعية ولكن يتم تدريبها باستخدام التعلم التنافسي بدلاً من تعلم تصحيح الخطأ (على سبيل المثال الانتشار العكسي مع النسب المتدرج)، والمستخدمة من قبل الشبكات العصبية الاصطناعية الأخرى.

الشبكة العصبية ذاتية التنظيم (SONN) هي نموذج تعليمي غير خاضع للإشراف في الشبكة العصبية الاصطناعية يُطلق عليها اسم خرائط ميزات التنظيم الذاتي أو خرائط (Kohonen)، حيث يتم استخدامه لإنتاج تمثيل منخفض الأبعاد (ثنائي الأبعاد عادةً) لمجموعة بيانات ذات أبعاد أعلى مع الحفاظ على الهيكل الطوبولوجي للبيانات.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: