بروتين الشبكة الإندوبلازمية:
الشبكة الإندوبلازمية (ER) هي عضية مهمة للخلايا حقيقية النواة، حيث يشارك في العديد من الأنشطة الخلوية الأساسية مثل مراقبة جودة إنتاج البروتين والتعرف على البروتينات المطوية بشكل خاطئ والتخليق الحيوي للدهون وإزالة السموم، والستيرويدات وأيض المركبات الغريبة الحيوية والحماية من الإجهاد الخلوي واستتباب الكالسيوم داخل الخلايا والإشارات داخل الخلايا.
قد يؤدي خلل (ER) إلى العديد من الأمراض مثل التليف الكيسي والسرطان وانتفاخ الرئة عند الأطفال والاضطرابات العصبية مثل نقص التروية ونوبات الصرع، إذ تشارك (ER) في العديد من التعديلات المشتركة وما بعد الترجمة مثل انقسام إشارة الببتيد وتشكيل رابطة ثنائي الكبريتيد والجليكوزيل المرتبط بـ N، وتشكيل (GPI) وهو ضروري أيضًا لما بعد معالجة انتقالية للبروتينات الإفرازية التي تجعلها أحد المكونات المهمة لنظام البروتين الإفرازي حقيقيات النوى.
بروتين شبكة إندوبلازمية مقيم:
يتم تصنيع البروتينات الإفرازية على (ER) الخام وتوجيهها عبر غشاء (ER) إلى التجويف من خلال عملية ترجمة مشتركة، إذ داخل (ER) يخضعون للارتباط بالجليكوزيل ويحققون شكلهم ثلاثي الأبعاد المحدد قبل نقلهم إلى المصب في النظام الإفرازي.
يتم تحقيق العملية برمتها بمساعدة العمل المنسق للغاية للعديد من البروتينات التي تشمل المرافق الجزيئية والإنزيمات المختلفة، لا يتم إفراز البروتينات التي تساعد (ER) في تنفيذ الوظائف المذكورة أعلاه وتسمى بروتينات ER المقيمة (ERRPs).
بالإضافة إلى (ERRPs) يتم أيضًا الاحتفاظ بالبروتينات المطوية بشكل غير صحيح أو غير المطوية مرة أخرى في (ER) وإعادة توجيهها للتحلل بواسطة البروتوزوم إذا تعذر تصحيح الخطأ لذلك، من أجل البقاء موضعيًا في (ER) يجب التعرف على (ERRPs) بدقة وتمييزه عن البروتينات أو بروتينات المسار الإفرازي الخاطئة.
ترتبط وظيفة (ER) بشكل معقد بجهاز جولجي على سبيل المثال على غرار (ER) من جهاز (Golgi) تنتقل البروتينات أيضًا تلقائيًا إلى غشاء البلازما أو الفجوات في غياب عملية الاحتفاظ النشطة.
كما يتم إجبار عدد من (ERRP) على التوطين في (ER) من خلال الاسترداد المستمر من مجمع غولجي يمكن استرداد بروتينات (Luminal ER) باستخدام النقل الرجعي بمساعدة تسلسل (C-terminal KDEL)، بينما تحتوي بروتينات الغشاء من النوع الأول بما في ذلك سكان (ER) والبروتينات المتجولة لنظام (ER / Golgi) على شكل ديليسين C طرفي يشير إلى استعادتها من البريد.
يعتقد أن تحديد جميع (ERRPs) ضروري لاستكشاف المزيد حول ارتباطاتها الوظيفية وفهم آلية (ER) الوظيفية بشكل أفضل، يعتمد (ERPred) على آلة ناقلات الدعم (SVM) وتركيبات الأحماض الأمينية الفردية لـ( 25 N-terminal و 25 C-terminal) والأحماض الأمينية المتبقية كمدخلات (SVM).
تم تطوير خادم ويب وبرنامج يمكن الوصول إليه مجانًا ويتنبأ بـ (ERRP) باستخدام تسلسل الأحماض الأمينية الخاصة بهم، حيث يأمل أن يساعد العمل في فهم أفضل للمسارات الإفرازية الخلوية بالإضافة إلى الوظائف الأخرى التي تتوسطها (ER).
مجموعات بيانات بروتينات (ER) البشرية:
يعد تجميع مجموعة البيانات أحد أهم الخطوات أثناء تطوير طريقة التنبؤ، ولتجنب أي غموض يجب أن تحتوي مجموعة البيانات التي يجب استخدامها لتدريب المتنبئ على بروتينات مشروحة تجريبية ذات جودة عالية.
وجد أن هناك قاعدة بيانات لبروتينات (ER) البشرية المعروفة والمحتملة على حد سواء تسمى (HERA)، ونظرًا لأن (HERA) لم يتم تحديثه ويحتوي على بروتينات بشرية فقط فقد تم اختيار (SwissProt) القسم المنسق يدويًا من قاعدة بيانات (UniProt ) البروتين لتنزيل البيانات.
لاسترداد (ERRPs) من (SwissProt) استخدمت المعايير التالية:
- يجب أن تكون البروتينات من أصل حقيقي النواة ومراجعتها.
- يجب أن تكون موجودة فقط في (ER).
- وجود مثبت من خلال دليل على مستوى البروتين.
- يجب أن يكون البروتين كامل الطول وليس مجزأ (v) يجب أن يحتوي على أكثر من 50 حمضًا أمينيًا لأن البروتينات الأصغر تكون في الغالب شظايا.
- يجب التحقق من موقع البروتين تجريبياً.
بالنسبة لمجموعة البيانات السلبية، تمت محاولة جمع جميع أنواع غير (ERRP) بحيث يتم تدريب المتنبئ على مجموعة بيانات شاملة ويمكنه بسهولة تمييز (ERRP) عن غير (ERRPs).
قد تحتوي البروتينات التي تم تنزيلها لإنشاء مجموعة بيانات على تسلسلات متشابهة أو متماثلة، وبالتالي إذا تم استخدامها دون تقليل التكرار بين البروتينات، فقد لا يكون الأداء الذي تم الحصول عليه أداءً حقيقيًا ولكن تقديرًا مبالغًا فيه.
اعتمدت معظم طرق التنبؤ استراتيجية مجموعة البيانات منخفضة التماثل لتقييم أداء المتنبئ، حيث تم تقليل التكرار إلى 40 ٪ باستخدام (CD-HIT) وتم الحصول على 124 (ERRPs) التي تم استخدامها كمجموعة بيانات إيجابية.