تطبيق تدابير التشابه الدلالي على علم الوجود

اقرأ في هذا المقال


يشير علماء الاجتماع إلى أن تطبيق تدابير التشابه الدلالي على علم الوجود تشمل التطبيقات المحتملة لهذه التدابير، كالبحث وتحليل البيانات واكتشاف المعرفة وذلك في أنظمة دعم القرار التي تستخدم علم الوجود.

تطبيق تدابير التشابه الدلالي على علم الوجود

مقاييس التشابه الدلالي تحدد أوجه التشابه بين المفاهيم في علم الوجود المعين، وتشمل التطبيقات المحتملة لهذه التدابير البحث واستخراج البيانات واكتشاف المعرفة في قواعد البيانات أو أنظمة دعم القرار التي تستخدم علم الوجود.

وحتى الآن لم تكن هناك مقارنات بين مناهج التشابه الدلالي المختلفة في أنطولوجيا واحدة، ويمكن لمثل هذه المقارنة أن تقدم نظرة ثاقبة على صحة الأساليب المختلفة، وتم مقارنة 3 مناهج لمقاييس التشابه الدلالية التي تعتمد على رأي الخبراء والأنطولوجيا فقط ومحتوى المعلومات مع 4 مقاييس مطبقة على علم الوجود.

ووجد أن هناك اتفاقًا ضعيفًا بين تلك المقاييس بناءً على محتوى المعلومات مع مقياس الأنطولوجيا فقط، والمقياس المعتمد فقط على هيكل الأنطولوجيا هو الأكثر ارتباطًا برأي الخبراء، وفي الوقت الحالي تتوسع مستودعات البيانات والبيانات الجينومية في المجال العام بوتيرة متفجرة.

وبدأت ثروة البيانات المتاحة للجمهور في تمكين دراسات المعلومات الحيوية الترجمية الشاملة والتكاملية، وأصبح استخدام علم الوجود بارزًا بشكل متزايد في مجال الطب الحيوي حيث تستمر مساهمة المعرفة الجديدة من المحققين في الارتفاع.

ويتم تسهيل تعدين الموارد العامة من خلال استخدام الأنطولوجيا القياسية لتوضيح التشخيصات والأمراض والظروف التجريبية لمجموعات البيانات المخزنة في المستودعات العامة، على سبيل المثال قد يرغب الباحث الذي يدرس الاختلافات الأليلية في الجين في معرفة جميع المسارات التي تتأثر بهذا الجين.

والأدوية التي يمكن تعديل آثارها من خلال الاختلافات الأليلية في الجين، وأي مرض يمكن أن يسببه الجين والتجارب السريرية التي درست الأدوية أو الأمراض المتعلقة بذلك الجين، المعرفة اللازمة لدراسة مثل هذه الأسئلة متوفرة في مجموعات البيانات العامة، التحدي هو العثور على تلك المعلومات.

التشابه الدلالي داخل الأنطولوجيا

ويشير التشابه الدلالي إلى قرب مفهومين داخل أنطولوجيا معينة، والمسافة بين مفهومين هي تمثيل عددي لمدى تباعد مفهومين عن بعضهما البعض في مساحة هندسية معينة، ويمكن اعتبارها معكوس التشابه الدلالي أي إذا كانت المسافة بين المفاهيم 0 فإن التشابه الدلالي هو 1 والعكس بالعكس.

وإذا كانت هذه العلاقة بين المسافة والتشابه الدلالي صحيحة، فإن وجود مقاييس التشابه أو المسافة يسمح باستخدام الأنطولوجيا للبحث بكفاءة عن العناصر ذات الصلة، أو لتحديد الارتباطات بين المفاهيم التي قد لا تكون واضحة على الفور للمستخدم.

وتلعب مقاييس التشابه إذن دورًا مهمًا في البحث داخل المجال الطبي الحيوي والتأكد من دقة عمليات البحث هذه وإرجاع نتائج أفضل من البحث عن الكلمات الرئيسية، وإنها تجعل من الممكن للآلات أداء مهام مثل البحث عن البيانات وتصنيفها واستخراجها بكفاءة، وأداء هذه المهام عبر موارد بيانات كبيرة ومتنوعة.

وإن تخصيص مقاييس التشابه هو موضوع الكثير من البحث، والمعيار الذهبي المقبول للتشابه هو الاتفاق بين الخبراء في مجال معين، وقد تم تقييم معظم المقاييس المشتقة باستخدام معيار مراجعة النظراء.

وتفترض استراتيجية محتوى المعلومات لحساب التشابه الدلالي أن التكرار الذي سيظهر مصطلح مع آخر ضمن مجموعة معينة من المعرفة أو المعلومات سيكون مرتبطًا بالتشابه بين المصطلحين، ويأخذ هذا النهج نظرة إحصائية للمعلومات لتحديد مدى قرب مصطلحين.

التشابه الدلالي وقياسات الارتباط

التشابه هو حالة خاصة من الترابط، يتم حساب الارتباط الدلالي باستخدام نموذج فضاء متجه، ونوع من مقياس التشابه الذي يميل إلى استخدامه مع ذلك، وإنه يقيس ميل كلمات الاستخدام معًا في جمل أو فقرات ومستندات، وفي المقابل التشابه الدلالي يسمى أحيانًا التشابه الطوبولوجي.

حيث يُقاس التشابه بالمسافة بين المصطلحات باستخدام علم الوجود، وعلم الوجود هو رسم بياني لا دوري موجه يحتوي على تعريف للعلاقات بين المصطلحات، وأحد الأمثلة على مثل هذه الأنطولوجيا هو قاموس دو سوسور، ومقياس التشابه مع استخدام علم الوجود هو أقصر طريق بين فصلين، بالإضافة إلى إجراءات المسار والعمق.

باختصار يلعب تمثيل النص الدلالي الدور الرئيسي لاستخراج الموضوعات الكامنة ذات التماسك الدلالي بالإضافة إلى التشابه الدلالي بين المصطلحات المستخدمة في نمذجة الموضوعات، وتم أخذ تمثيل النص الدلالي المستند إلى التشابه الدلالي في الاعتبار في نمذجة الموضوع.

تحلل الموضوع الكامن

يتم توجه الانتباه إلى الدلالات التي تهدف إلى الكشف عن الموضوعات المجردة من البيانات، ويتم البدأ بالنماذج الاحتمالية، حيث أجرى العلماء مراجعة شاملة لمختلف تقنيات نمذجة موضوع النص القصير، ويعتمد هذا الاستطلاع على ثلاث فئات من الطرق:

أولاً، يعتمد على خليط متعدد الحدود.

والثاني، يعتمد على التكرار العالمي للكلمات.

والأخير، يعتمد على التجميع الذاتي.

وقاموا بتقييم هذه الأساليب الحديثة على العديد من مجموعات البيانات الواقعية ومقارنة أدائها ببعضها البعض مقابل دلالات نمذجة موضوع النص الطويل، ولم يشر هذا العمل إلى أي تمثيل دلالي لمجموعات البيانات.

ويعتمد على التحديد التلقائي للكلمات الرئيسية المميزة لموضوعات للعمل على نص عادي، ويفترض هذا النموذج أن موضوعات الكلمة في سلسلة من الكلمات تتأثر بشدة بالكلمات الموجودة في نفس التسلسل، لذلك قد يتم تخصيص الكلمات القريبة من الكلمة ذات الدرجة العالية من الكلمات الرئيسية لموضوع تلك الكلمة، حتى لو كانت من غير المرجح أن تكون منفردة للموضوع.

وفي العملية التوليدية افترض علماء الاجتماع أن دمج مثل هذه المعلومات الوصفية مباشرة في العملية التوليدية لنماذج الموضوع يمكن أن يحسن دقة النمذجة وجودة الموضوع، خاصة في حالة عدم كفاية معلومات حدوث الكلمات في بيانات التدريب.

وقد طور العلماء نموذج تعلم العلامات المترابط للمؤسسات شبه المنظمة بناءً على نموذج الموضوع لتمكين بناء الرسم البياني للارتباط بين العلامات عبر عملية مشاركة عادية لوجستية، كما اقترحوا نموذج موضوع احتمالي يدمج المعرفة الدلالية في نموذج الموضوع لوضع علامات على صفحات الويب والمستندات عبر الإنترنت مع الموضوعات المكتشفة.

السيميائية هي محور التعلم المبتكر ومواد التدريس

شكلت كتب الرياضيات الرقمية والمواد التعليمية التي تدمج الرسوم البيانية التفاعلية والأمثلة المرئية التفاعلية والعروض التوضيحية المرئية مجالًا متميزًا للبحث في تعليم الرياضيات، وتساعد السيميائية على فهم التحديات التي تحركها هذه المواد، وبعض المواضيع الهامة هي كما يلي:

1- أدوات تصور مبتكرة للتعليم والتعلم.

2- تصميم الأنشطة والمهام التي تستند إلى أمثلة مرئية تفاعلية.

3- أنماط القراءة والاستخدام والحل مع تمثيلات متعددة مرتبطة تفاعلية.

4- أدوار المخططات والرسوم المتحركة والفيديو كأدوات تعليمية بتقنيات جديدة.

وتعرض إحدى الدراسات الحديثة الأنواع المختلفة من العمل الذي يحتاج الطلاب إلى إنجازه لربط الظواهر الطبيعية وأنظمة الإشارات الديناميكية المختلفة القائمة على الكمبيوتر والصور والرسوم البيانية التي تُستخدم لتمثيل الأول.

وفي كل حالة أي في الظواهر الطبيعية وأنظمة الإشارات يلزم العمل الهيكلي للانتقال من القاعدة المادية إلى الهيكل، وقد يتم بعد ذلك ربط ومقارنة هياكل الأنظمة المختلفة، مما يؤدي غالبًا إلى مراجعة في عملية الهيكلة، ومما يتيح أشكالًا جديدة أو علاقات بين الأنظمة المختلفة.


شارك المقالة: