اقرأ في هذا المقال
- ما هي المصفوفات الدقيقة للحمض النووي
- بيانات المصفوفة الدقيقة للحمض النووي
- طرق زيادة قوة الكشف عن(DEGs)
- تقدير عدد الجينات المراد تصفيتها
ما هي المصفوفات الدقيقة للحمض النووي:
في تجارب المصفوفة الدقيقة للحمض النووي تم اكتشاف نمط تعبير لآلاف الجينات مما يعطي إمكانية عكس الحالات البيولوجية للخلايا، إن الاستخدام الأساسي لمصفوفات الحمض النووي الدقيقة هو تحديد الجينات المعبر عنها بشكل تفاضلي بين الظروف المختلفة، إذ يمكن تحديد الجينات المعبر عنها تفاضليًا (DEGs) على أساس معايير مختلفة، وغالبًا ما يتم تحديدها على أساس قيم p للاختبارات الإحصائية.
(DEGs) هي خصائص مهمة للنتائج التجريبية يتم تلخيصها في ما يسمى بالتوقيعات الجينية، وتستخدم كذلك في العديد من السياقات، حيث يمكن التحقق بشكل أكبر من كفاءة تحديد (DEGs)، على سبيل المثال عن طريق إجراء تجارب تصنيف العينة بناءً على توقيعات التعبير الجيني المختارة من أعلى الجينات المعبر عنها تفاضليًا، كما تمت دراسة مشكلة تكوين بصمات التعبير الجيني لاستخدامها في المصنفات الجزيئية.
بيانات المصفوفة الدقيقة للحمض النووي:
تُستخدم المصفوفات الدقيقة للحمض النووي لاكتشاف الجينات المعبر عنها تفاضليا بين الظروف البيولوجية المختلفة، حيث في تجارب ميكروأري غالبًا ما يكون عدد العينات التي تم تحليلها أقل بكثير من عدد الجينات (مجموعات التحقيق) مما يؤدي إلى العديد من الاكتشافات الخاطئة.
تتحكم طرق تصحيح الاختبار المتعددة في عدد الاكتشافات الخاطئة، ولكنها تقلل من حساسية اكتشاف الجينات المعبر عنها تفاضليا فيما يتعلق بهذه المشكلة، إذ تم اقتراح طرق التصفية لتحسين قوة اكتشاف الجينات المعبر عنها تفاضليًا وهذه التقنيات عبارة عن إجراءات من خطوتين، حيث يتم في الخطوة الأولى إزالة مجموعة من الجينات غير المفيدة وفي الخطوة الثانية يتم استخدام مجموعة الجينات المحتجزة فقط للبحث عن الجينات المعبر عنها تفاضليًا.
يمثل التحدي في تحديد (DEGs) استنادًا إلى بيانات المصفوفة الدقيقة للحمض النووي مشكلة في الأبعاد، بحيث أن عدد صغير من العينات مقابل عشرات الآلاف من تعبيرات الجينات التي تم قياسها في كل عينة يؤدي عدد كبير من الاختبارات الإحصائية؛ للعثور على (DEGs) إلى حدوث العديد من الاكتشافات الخاطئة بين الجينات التي يطلق عليها التعبير التفاضلي.
يمكن أن تتجلى هذه المشكلة بشكل أكبر في عدم إمكانية إنتاج نتائج دراسات مختلفة، على سبيل المثال لم يتم العثور على(DEGs)الذي تم اكتشافه في دراسة أخرى أو أن المصنف الجزيئي المصمم في دراسة لا يتنبأ بشكل صحيح بحالة العينة للبيانات المماثلة التي تم جمعها في أخرى دراسة، إذ يمكن التحكم في نسبة الاكتشافات الخاطئة بين الجينات التي يُطلق عليها التعبير التفاضلي (معدل الاكتشاف الخاطئ، FDR) باستخدام التصحيحات للاختبارات المتعددة ومع ذلك فإن وضع قيود على (FDR)يؤدي إلى تقليل حساسية الإجراء لاكتشاف (DEGs).
فيما يتعلق بالمشكلة الموصوفة أعلاه تم اقتراح طرق لزيادة قوة الكشف لبيانات المصفوفة الدقيقة للحمض النووي أي لتحسين حساسية عملية اكتشاف (DEGs) مع الحفاظ على (FDR) تحت السيطرة، حيث تعتمد هذه الطرق على إجراءات من خطوتين، حيث تكون الخطوة الأولى هي الاختيار المسبق (التصفية) التي تهدف إلى إزالة بعض مجموعة الجينات غير المفيدة ، والخطوة الثانية هي اكتشاف (DEGs) في مجموعة الجينات المحتجزة، وإذا كانت مجموعة الجينات التي تمت إزالتها في الخطوة الأولى لا تشتمل على (DEGs)أو تشتمل على عدد قليل منها فقط تتحسن قوة الكشف لعملية اكتشاف (DEGs).
طرق زيادة قوة الكشف عن(DEGs):
يمكن تجميع طرق زيادة قوة الكشف عن(DEGs)، وفقًا للمعايير المستخدمة لتصفية الجينات غير الإعلامية، إذ تتضمن المجموعة الأولى طرقًا تستند إلى إدخال عتبات للوسائل أو الاختلافات في إشارات التعبير الجيني، وقد تبين أنه بالنسبة لنطاقات معينة من القيم الحدية لوسائل أو تباينات التعبيرات الجينية (أو اللوغاريتمات الأساسية 2)، فإن التصفية تزيد من حساسية اكتشاف (DEGs).
تتضمن المجموعة الثانية طرقًا تستند إلى مكالمات الكشف (الملصقات) المخصصة لمجموعات التحقيق بواسطة إجراء المعالجة المسبقة للإشارة (Affymetrix MAS 5.0) وتهدف هذه الملصقات إلى توضيح ما إذا كان مرنا محددًا يمكن اكتشافه (تظهر التطابقات المثالية إشارة تهجين أعلى من عدم التطابق المقابل)، بناءً على رفض الفرضية الصفرية في اختبار تصنيف موقع ويلكوكسون، وهي طريقة تعتمد على مكالمات الكشف عن المسبار، حيث تزيل جميع الجينات باستثناء الجزء المسمى الحاضر في مجموعة واحدة على الأقل من العينات.
قارن(Hackstadt وHess) طرق استدعاء الكشف وطرقها بناءً على ترشيح المتوسط والتباين الكلي على مستوى مجموعة مسبار في مجموعات مختلفة مع طريقتين للتحكم في (FDR)وثلاث طرق معالجة مسبقة، ولقد اكتشفوا أن كلتا طريقتين التصفية من خلال استدعاء الكشف والتباين (على المقياس الأصلي) المقترنة بأي من طرق تصحيح الاختبار المتعددة لمعدل الاكتشاف الخاطئ، التي تم النظر فيها أدت إلى زيادة في عدد الجينات المعبر عنها تفاضليًا المحددة.
تتضمن المجموعة الثالثة طرقًا تعتمد على نماذج إحصائية ملائمة لسبر بيانات مجموعات التعبير، إذ يمكن أن تكون هذه النماذج نماذج تحليل العوامل أو نماذج تحليل المكونات الرئيسية (PCA)، والتي تستكشف مصادر (مكونات) التباين في البيانات وتسمح للباحثين بالاحتفاظ فقط بالجينات المقابلة للمكونات ذات التباين الكبير بدرجة كافية.
هناك طريقة تسمى (I / NI – calls)، اقترحها (Talloen et al)، بحيث يعتمد على تقريب قيم كثافة المجس بواسطة منتجات ذات أحمال وعوامل غير معروفة، إذ يفترض مؤلفو القيم السابقة العادية لعمليات التحميل ويقدرون تباين إشارة مجموعة المسبار من خلال تباين العامل المخفي (معطيات معينة)، ويسمون مجموعة التحقيق بالمعلومات إذا تجاوز تباين العامل المخفي العتبة المفترضة.
لو وآخرون اقترح إستراتيجية أخرى أبسط لتصفية الجينات غير الإعلامية (مجموعات المسبار)، والتي تستخدم تحليل(PCA) على بيانات مستوى المسبار، حيث يسمون طريقتهم (PVAC)(نسبة التباين التي يحسبها المكون الرئيسي الأول) ويستخدمون التباين الذي تم التقاطه بواسطة المكون الرئيسي الأول كمقياس للاتساق بين التحقيقات في مجموعة التحقيق، وبالتالي كعتبة لتصفية الجينات، كما تُظهر طريقة (PVAC) حساسية مماثلة للطريقة التي أبلغ عنها (Talloen et al) لكن استخدامه يوفر العديد من المزايا، إذ لا تعتمد على أي افتراضات توزيع ولا يلزم اختيار معلومات مسبقة، والنهج هو أيضا أبسط من الناحية الحسابية وبالتالي أكثر عملية.
يجب إنشاء إجراءات من خطوتين لاكتشاف (DEGs) بطريقة تجعل الخطوة الأولى من تصفية الجينات غير محددة (عمياء في تسميات الفصل)؛ أي يتم تجاهل المعلومات الخاصة بتسميات فئة العينات وإلا فقد السيطرة على (FDR)، في ورقة بحثية حديثة أعدها (Bourgon et al) فهي تستمد شرط “الاستقلال الهامشي” الأكثر تقييدًا ودقة، والذي ينص على أن معيار تصفية الجينات في الخطوة الأولى وإحصاءات الاختبار لاكتشاف (DEGs) في الخطوة الثانية يجب أن يكون مستقلاً بموجب فرضية العدم.
يمكن أن يؤدي انتهاك هذا الشرط مرة أخرى إلى فقدان تحكم(FDR) مجموعة من الإجراءات المكونة من خطوتين لاكتشاف (DEGs) التي تم إنشاؤها بطريقة تعتمد فيها الخطوة الأولى على تحديد العتبات على متوسطات العينة أو الفروق وإحصائيات الاختبار في الخطوة الثانية من خلال توزيع t تم إثباتها إلى استيفاء شرط الاستقلال الهامشي، ولذلك فإن هذه الأساليب ذات أهمية خاصة بسبب موثوقية القيم المقدرة للحساسيات و(FDRs).
تقدير عدد الجينات المراد تصفيتها:
المعلمة الأساسية في هذه الطرق هي حجم مجموعة الجينات المراد تصفيتها، إذ يُعد اختيار هذه المعلمة ذو أهمية حاسمة لأن تصفية عدد قليل جدًا من الجينات لا يحسن الحساسية بدرجة كافية في حين أن تصفية الكثير من الجينات يمكن أن يؤدي إلى إزالة(DEGs) مع الجينات غير المفيدة، ومشكلة اختيار حجم مجموعة الجينات المراد تصفيتها تم الأخذ في الاعتبار طريقتين لتحديد هذا الرقم.
في الطريقة الأولى يتم تقدير عدد الجينات المراد تصفيتها على أساس عدد مجموعات المجسات المسماة “غائبة” بواسطة إجراء المعالجة المسبقة للإشارة( Affymetrix MAS 5.0)، كما يوصى أيضًا بطريقة أخرى أبسط لتصفية 50٪ من مجموعات المجسات، حيث أن لو وآخرون استخدم أيضًا هذه التوصية للتصفية حسب المتوسط العام أو التباين، ومع ذلك قد تحتوي مجموعات البيانات المختلفة على أعداد مختلفة من الجينات غير الإعلامية، لذا فإن استخدام نسبة ثابتة (50٪ أو قيمة أخرى) من الجينات التي تمت تصفيتها قد يؤدي إلى فقدان كفاءة طريقة الترشيح.
لذلك إن مشكلة الاختيار التكيفي لحجم مجموعة الجينات المراد تصفيتها، حيث تعني بالاختيار التكيفي النهج مع مستوى عتبة التصفية اعتمادًا على توزيع احتمالية الإشارة التي تم تحليلها (متوسط العينة أو التباين)، إذ يقترح طريقة تعتمد على تحلل دالة كثافة الاحتمال إلى خليط من مكونات غاوسية، وعلى الفرضية القائلة بأن المحتوى الجيني للمكونات الغاوسية ذو مغزى فيما يتعلق بالحالة الإعلامية مقابل الحالة غير الإعلامية للجينات، كما تستخدم طريقة الاحتمالية القصوى مع خوارزمية EM للحصول على التحليلات حسابيًا، وأيضًا بمقارنة نتائج طريقة التصفية التكيفية الخاصة بالنتائج التي تم الحصول عليها في المراجع.