تحديد العطل في المعدات الكهربائية بواسطة خوارزمية خاصة

اقرأ في هذا المقال


الحاجة لتحديد العطل في المعدات الكهربائية المعالجة الخاصة لها

يتم جمع قدر كبير من بيانات الأعطال أثناء إجراءات تشغيل وصيانة نظام الطاقة الكهربائية، بحيث تتكون هذه البيانات من نصوص شبه منظمة وغير منظمة، كما تشير إلى نسبة كبيرة من معدات أنظمة الطاقة الحديثة، كما وتحتوي على معلومات مهمة ذات صلة كبيرة بسلامة شبكة الطاقة وأمنها، ومع ذلك يمكن استخدام عدد قليل فقط من هذه النصوص (قوائم الأعطال) في الوقت الحاضر.

ومن خلال تطبيق تقنية معالجة اللغة الطبيعية (NLP)؛ فإنه يمكن تحليل نصوص الأعطال هذه بشكل فعال للحصول على معلومات أكثر فائدة، مثل أسماء المعدات ومعدلات فشلها المقابلة، حيث أن هذه المعلومات حيوية للصيانة ولرصد حالة أنظمة الطاقة الكهربائية.

كما أن التعرف على الكيان المُسمى (NER) هو تقنية أساسية في البرمجة اللغوية العصبية تستخدم لتحديد الكيانات مثل الأشخاص والمواقع والمؤسسات والتواريخ في النصوص (NER) هو أساس استخراج العلاقة بين الكيانات والرسوم البيانية المعرفية وأنظمة الإجابة التلقائية على الأسئلة، والتي تم تطبيقها على نطاق واسع في العديد من المجالات الأخرى، لذلك يعد (NER) نهجاً عملياً محتملاً لتعدين المعلومات الهامة من نصوص أعطال المنشآت الكهربائية.

ومع ذلك؛ فإن نص مجال صيانة نظام الطاقة عبارة عن بيانات غير منظمة، والتي ليس لها شكل محدد وتفتقر إلى دلالات مفهومة آلياً، وبالتالي فإن تحويلها إلى بيانات منظمة أمر ضروري قبل المزيد من التعدين، وعلاوة على ذلك ومع توسع أنظمة الطاقة؛ تستمر بعض أنواع الكيانات في النمو، مثل عدد الخطوط وأسماء الشركات المصنعة.

كما يقدم هذا طلباً على مجموعة نصية ضخمة ويؤدي في النهاية إلى مشاكل في استخراج الكيانات المقيدة بفاعلية هذه المجموعات وقابليتها للتوسع، لذلك من الصعب معالجة هذه المشكلة باستخدام طريقة (NER) واحدة، وفي الوقت الحالي؛ فإنه لا يوجد إطار (NER) مقبول لأداء الاستخراج الشامل للكيان من نصوص أعطال المعدات الكهربائية بسبب التعقيدات المذكورة أعلاه.

وفيما يتعلق باللغات المختلفة؛ فإنه من الضروري مراعاة الاختلافات في معالجة النص بين الصينية والإنجليزية، بحيث توجد دائماً مسافة طبيعية بين الكلمات في النصوص الإنجليزية، مما يجعل من السهل تقسيم الكلمات في النصوص الإنجليزية، ومع ذلك؛ فإن النصوص الصينية تفتقر إلى الفاصل الطبيعي ولها أشكال معقدة (تتكون الكيانات من أحرف متعددة)، مما يجعل التعرف على الكيانات المسماة في النصوص الصينية أكثر صعوبة.

الأعمال ذات الصلة بتحديد أعطال المعدات الكهربائية

تتضمن طريقة (NER) بشكل أساسي مناهج تستند إلى القواعد والتعلم الآلي الإحصائي والتعلم العميق، على سبيل المثال طُبق قالب قاعدة التركيب المستند إلى الفتحات لتعميم قالب الحرف الوصفية لاستخراج العوامل الحاسمة لأنظمة الطاقة، مثل مواقع المعدات والأنطولوجيا المتضمنة والفهارس المقابلة وقيم الفهرس من نصوص ما قبل التخطيط غير المهيكلة.

وبالإضافة إلى ذلك؛ فقد اعتمد طريقة قائمة على القواعد لأداء (NER) لتشغيل وصيانة معدات الطاقة، بحيث اعتمدت الطريقة القائمة على القواعد بشكل أساسي نماذج التعلم الآلي مثل آلات ناقلات الدعم كمصنفات لإجراء التنقيب عن النص من سجلات عيوب نظام الطاقة، مثل معلومات العيوب الحاسمة لمعدات الطاقة.

وأخيراً أنشأت رسماً بيانياً للمعرفة بناءً على الرسم البياني الناتج، بحيث طُبق أيضاً نهجاً قائماً على القواعد يتضمن قاموساً للأنطولوجيا وإطاراً دلالياً لاستخراج مكونات الخلل والسمات، لمزيد من البحث؛ حققت الأساليب المستندة إلى القواعد أداءً جيداً لاستخراج كيانات محددة، ومع ذلك؛ فإنه من الصعب التكيف مع نصوص اللغة المعقدة بسبب ضعف تعميمها.

كما يوفر التعلم الآلي العديد من الحلول الفعالة لمعالجة هذه المشكلة، بحيث اقترح خوارزمية التعرف على الكيانات المسماة والتي استخرجت كيانات نظام الطاقة بناءً على الحقول العشوائية المشروطة (CRF) ونماذج الذاكرة طويلة المدى ثنائية الاتجاه (BLSTM)، كما حقق نموذج (CRF) دقة تبلغ (83٪)، مما يشير إلى أنه يمكنه تحديد كيانات الطاقة بشكل أفضل من نموذج (BLSTM).

وبالإضافة إلى ذلك، عدت ترددات الكلمات في نص نظام الطاقة من خلال خوارزمية (TF-IDF)، كذلك من خلال ترتيب نتائج (TF)، بحيث كانوا قادرين على استخراج المعلومات الهامة لارتفاع (TF)، ومع ذلك يتم تدريب الأساليب المذكورة أعلاه من خلال مجموعات البيانات المصنفة، كما وتعتمد النتائج التجريبية بشكل كبير على جودة مجموعة بيانات التدريب، وعلاوة على ذلك يتأثر الأداء التجريبي أيضاً بميزات نصية مختلفة ويلزم تحسين عالمية ودقة الخوارزمية.

إطار استخراج الكيان لأعطال الأجهزة الكهربائية ونصها

يمكن تعريف الكيان لأعطال الأجهزة الكهربائية ونصها من خلال تحليل نصوص الأعطال والعيوب في المعدات الكهربائية المقدمة من شركة شبكة الطاقة والإشارة إلى معايير التقييم لموثوقية مرافق نقل وتحويل الطاقة، بحيث تم القيام بتصنيف النصوص التي تحتوي على أعطال في المعدات الكهربائية وعيوبها في (8) أنواع من الكيانات، وهي اسم الجهاز واسم المكون ونوع العطل ومستوى الجهد الكهربائي ووقت الإنتاج أو التشغيل ومستوى العطل وأسماء الخطوط وأسماء الشركات المصنعة.

وبعد ذلك، فقد تم تجميع الكيانات في ثلاث فئات لمعالجة كتالوجات متشابهة للكيانات باستخدام نفس النهج، وعلى وجه التحديد تمثل كيانات الفئة الأولى الأسماء المناسبة في مجال الطاقة الكهربائية، بما في ذلك اسم الجهاز واسم المكون ونوع العطل ومستوى العطل ومستوى الجهد وأنواع الكيانات المحدودة.

على سبيل المثال، يحتوي مستوى الأعطال أيضاً على كتالوجات محدودة (على سبيل المثال، عيوب الطوارئ والعيوب الكبيرة)، وبالنسبة للأسماء الصحيحة، يكون النهج القائم على القاموس لاستخراج الكيانات فعالاً ومباشراً، وبالمثل ينتمي كل من وقت الإنتاج ووقت التشغيل إلى كيانات زمنية، لذلك يتم تصنيفها إلى كيانات من الفئة الثانية التي يمكن معالجتها بشكل مناسب بواسطة أداة (LTP).

كما أن كيانات الفئة الثالثة قابلة للتوسعة بشدة وتتضمن أسماء الخطوط والشركات المصنعة، ومع توسع شبكة الطاقة وبقاء الشركات الأصلح فقط، تغطي أسماء خطوط المعدات وأسماء الشركات المصنعة نطاقاً متزايداً مما يجعل من المستحيل استخدام طريقة مطابقة القاموس لتمثيل جميع أسماء الخطوط والشركات المصنعة، لذلك؛ فإن استخراج أسماء الخطوط وأسماء الشركات المصنعة هو محور هذه الدراسة، كما أُقترح نموذج (BERT-CRF) لحل هذه المشكلة.

وفقاً لنظام تصنيف الكيان المذكور أعلاه، يوضح الشكل التالي إطار طريقة المعالجة الهجينة والبرمجة اللغوية العصبية المقترحة لاستخراج الكيان لنص أعطال المعدات الكهربائية، أولاً يتم تنفيذ عمليات المعالجة المسبقة مثل تجزئة الكلمات على البيانات النصية، ثم يتم استخراج الكيانات باستخدام القاموس وأداة (LTP) ونموذج (BERT-CRF)، بحيث تنفذ الخوارزمية الهجينة هذه الخوارزميات الثلاثة بالتوازي وتجمع نتائجها، كما يمكنه تلقائياً استخراج الكيان (a) للفئة الأولى والكيان (b) للفئة الثانية والكيان (c) للفئة الثالثة.

yu1-3063354-large-1-300x179


شارك المقالة: