مفهوم المعلوماتية الحيوية:
تعرف المعلوماتية الحيوية بانها علم يربط البيانات البيولوجية بتقنيات تخزين المعلومات وتوزيعها وتحليلها؛ لدعم مجالات متعددة من البحث العلمي بما في ذلك الطب الحيوي، حيث يتم تغذية المعلوماتية الحيوية من خلال تجارب توليد البيانات عالية الإنتاجية، بما في ذلك تحديد التسلسل الجيني وقياسات أنماط التعبير الجيني.
تقوم مشاريع قواعد البيانات برعاية البيانات والتعليق عليها ثم توزيعها عبر شبكة الويب العالمية، إذ يؤدي التنقيب عن هذه البيانات إلى اكتشافات علمية وتحديد تطبيقات إكلينيكية جديدة، وفي مجال الطب على وجه الخصوص تم اكتشاف عدد من التطبيقات الهامة للمعلوماتية الحيوية، يتم استخدام المعلوماتية الحيوية لتحديد الارتباطات بين تسلسل الجينات والأمراض للتنبؤ بهياكل البروتين من تسلسل الأحماض الأمينية، وكذلك للمساعدة في تصميم الأدوية ولتكييف العلاجات للمرضى الفرديين بناءً على تسلسل الحمض النووي الخاص بهم، وهو ما يعرف بعلم الصيدلة الجيني.
تجمع المعلوماتية الحيوية باعتبارها تخصصًا جديدًا ناشئًا بين الرياضيات وعلوم المعلومات والبيولوجيا وتساعد في الإجابة على الأسئلة البيولوجية، حيث تم استخدام كلمة المعلوماتية الحيوية لأول مرة في عام 1968، كما تمت الإشارة إلى المعلوماتية الحيوية باسم علم الأحياء الحسابي، ومع ذلك بالمعنى الدقيق للكلمة يتعامل علم الأحياء الحسابي بشكل أساسي مع نمذجة الأنظمة البيولوجية.
إن المكونات الرئيسية للمعلوماتية الحيوية هي:
- تطوير أدوات وخوارزميات برمجية.
- تحليل وتفسير البيانات البيولوجية باستخدام مجموعة متنوعة من أدوات البرمجيات وخوارزميات معينة.
بيانات المعلوماتية الحيوية:
البيانات الكلاسيكية للمعلوماتية الحيوية تشمل:
- تسلسل الحمض النووي للجينات.
- الجينوم الكامل تسلسل الأحماض الأمينية للبروتينات.
- التراكيب ثلاثية الأبعاد للبروتينات والأحماض النووية.
- مجمعات البروتين والحمض النووي.
كما تتضمن تدفقات بيانات (omics) الإضافية وهي:
- النسخ.
- نمط تخليق الحمض النووي الريبي من الحمض النووي البروتينات.
- توزيع البروتينات في خلايا التفاعلات.
- أنماط تفاعلات البروتين والبروتينات والحمض النووي.
- علم الأيض.
- الطبيعة وأنماط المرور لتحولات الجزيئات الصغيرة بواسطة المسارات البيوكيميائية النشطة في الخلايا.
في كل حالة هناك اهتمام بالحصول على بيانات شاملة ودقيقة لأنواع خلايا معينة، وتحديد أنماط التباين داخل البيانات، على سبيل المثال قد تتقلب البيانات اعتمادًا على نوع الخلية وتوقيت جمع البيانات أثناء دورة الخلية أو التغيرات اليومية أو الموسمية أو السنوية ومرحلة التطور والظروف الخارجية المختلفة، حيث توسع الميتاجينوميات و(metaproteomics) هذه القياسات لتشمل وصفًا شاملاً للكائنات الحية في عينة بيئية، كما هو الحال في دلو من مياه المحيط أو في عينة من التربة.
كانت المعلوماتية الحيوية مدفوعة بالتسارع الكبير في عمليات توليد البيانات في علم الأحياء، وربما تُظهر طرق تسلسل الجينوم التأثيرات الأكثر دراماتيكية، ففي عام 1999 احتوت محفوظات تسلسل الحمض النووي على ما مجموعه 3.5 مليار نيوكليوتيد؛ أي أكثر بقليل من طول جينوم بشري واحد، وبعد عقد من الزمن احتوت على أكثر من 283 مليار نيوكليوتيد أي بطول حوالي 95 جينوم بشري.
عملت معاهد الصحة الوطنية على إقامة تحدي للباحثين؛ وذلك من خلال تحديد هدف لتقليل تكلفة تسلسل الجينوم البشري إلى 1000 دولار، والذي من شأنه أن يجعل تسلسل الحمض النووي أداة عملية وميسورة التكلفة للمستشفيات والعيادات، مما يجعلها مكونًا قياسيًا للتشخيص.
تخزين واسترجاع البيانات:
تستخدم بنوك البيانات لتخزين البيانات وتنظيمها للمعلوماتية الحيوية، حيث أن العديد من هذه الكيانات تجمع تسلسلات الحمض النووي والحمض النووي الريبي من الأوراق العلمية ومشاريع الجينوم، كذلك العديد من قواعد البيانات في أيدي اتحادات دولية.
على سبيل المثال لجنة استشارية مكونة من أعضاء قاعدة بيانات تسلسل النيوكليوتيدات لمختبر البيولوجيا الجزيئية الأوروبية (EMBL-Bank) في المملكة المتحدة وبنك بيانات الحمض النووي في اليابان (DDBJ) وبنك (GenBank) التابع للمركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) في الولايات المتحدة، حيث تشرف على التعاون الدولي لقاعدة بيانات تسلسل النيوكليوتيدات (INSDC)؛ للتأكد من أن بيانات التسلسل متاحة مجانًا، حيث تتطلب المجالات العلمية إيداع تسلسلات النيوكليوتيدات الجديدة في قاعدة بيانات متوافرة للجمهور، كما تنطبق شروط مماثلة على هياكل الحمض النووي والبروتينات، وتوجد أيضًا متصفحات للجينوم وقواعد بيانات تجمع كل المعلومات الجينومية والجزيئية المتاحة حول نوع معين.
تشكل قاعدة البيانات الرئيسية للهيكل الجزيئي البيولوجي بنك بيانات البروتين العالمي (wwPDB)، وهو جهد مشترك بين البحوث التعاونية للمعلوماتية الحيوية الهيكلية (RCSB) في الولايات المتحدة وبنك بيانات البروتين في أوروبا (PDBe) في المعهد الأوروبي للمعلومات الحيوية في المملكة المتحدة وبنك بيانات البروتين الياباني، حيث تحتوي الصفحات الرئيسية لشركاء (wwPDB) على روابط لملفات البيانات نفسها ومواد توضيحية ودروس ومرافق لإيداع الإدخالات الجديدة وبرامج بحث متخصصة لاسترداد الهياكل، كما يتم استخدم أدوات قياسية لاسترجاع المعلومات من أرشيفات البيانات وتحديد عناصر البيانات عن طريق كلمات رئيسية واسترداد تسلسل الأحماض الأمينية للجزيء.
أهداف المعلوماتية الحيوية:
إن تطوير خوارزميات فعالة لقياس تشابه التسلسل يعتبر هدف مهم للمعلوماتية الحيوية، حيث تضمن خوارزمية (Needleman-Wunsch) التي تعتمد على البرمجة الديناميكية العثور على المحاذاة المثلى لأزواج التسلسلات، وتقسم هذه الخوارزمية بشكلٍ أساس المشكلة الكبيرة للتسلسل الكامل إلى سلسلة من المشكلات الأصغر، كما أنها تستخدم حلول المشكلات الأصغر لإنشاء حل للمشكلة الكبيرة.
تعتبر خوارزمية (Needleman-Wunsch) فعالة إلا أنها بطيئة جدًا في التحقق من قاعدة بيانات تسلسل كبير، لذلك تم إيلاء الكثير من الاهتمام لإيجاد خوارزميات سريعة لاسترجاع المعلومات، يمكنها التعامل مع الكميات الهائلة من البيانات في الأرشيفات، وهدف آخر للمعلوماتية الحيوية توسيع البيانات التجريبية بالتنبؤات، إذ أن الهدف الأساسي لعلم الأحياء الحسابي هو التنبؤ ببنية البروتين من تسلسل الأحماض الأمينية، حيث يظهر الطي العفوي للبروتينات أن هذا يجب أن يكون ممكنًا.
يتم استخدام المعلوماتية الحيوية كذلك للتنبؤ بالتفاعلات بين البروتينات وبالنظر إلى الهياكل الفردية للشركاء ويعرف هذا باسم مشكلة الإرساء، حيث تُظهر مجمعات البروتين تكاملًا جيدًا في شكل السطح والقطبية ويتم تثبيتها إلى حد كبير عن طريق التفاعلات الضعيفة مثل دفن السطح الكارهة للماء والروابط الهيدروجينية وقوى فان دير فال.
تحاكي برامج الكمبيوتر هذه التفاعلات للتنبؤ بالعلاقة المكانية المثلى بين شركاء الربط، إذ يتمثل أحد التحديات الخاصة التي يمكن أن يكون لها تطبيقات علاجية مهمة في تصميم جسم مضاد يرتبط بدرجة عالية من التقارب مع البروتين المستهدف، حيث كانت جميع أبحاث المعلوماتية الحيوية تركيز وبشكلٍ ضيق على إيجاد خوارزميات لتحليل أنواع معينة من البيانات مثل تسلسل الجينات أو هياكل البروتين.
تعتبر أهداف المعلوماتية الحيوية أهداف تكاملية إذ تهدف إلى معرفة كيفية استخدام مجموعات من أنواع مختلفة من البيانات لفهم الظواهر الطبيعية بما في ذلك الكائنات الحية والأمراض.