الخوارزميات الصوتية Phonetic Algorithms

اقرأ في هذا المقال


ما هي الخوارزميات الصوتية؟

وهي خوارزميات تقوم بمقارنة الكلمات ومطابقتها من خلال نطقها، بدلاً من مجرد تهجئتها، وقد لعبت الخوارزميات الصوتية وتقنيات “fuzzy matching” دورًا أساسيًا في العديد من الأنشطة بما في ذلك التصحيح الإملائي، ربط سجلات قواعد البيانات، وتوصيات البحث، وقد تم إنشاؤها للمساعدة في تحليل بيانات التعداد السكاني في الولايات المتحدة في أوائل القرن العشرين

كيف تعمل خوارزميات الصوتية؟

تعمل الخوارزميات الصوتية عن طريق تقسيم الكلمات إلى أصوات بدلاً من تهجئة. واحدة من الخوارزميات الصوتية الأكثر استخدامًا هي “Soundex”، وغالبًا ما تكون الخوارزميات الصوتية الأخرى عبارة عن تطويرات وتحسينات لـ “Soundex”، ويمكن أن تكون بمثابة مثال لكيفية عمل الخوارزميات الصوتية بشكل عام، حيث تقوم خوارزمية “Soundex” بتشفير الكلمات (عادةً ما تكون أسماء) كحرف متبوعًا بثلاثة أرقام، تجميع هذه الأرقام يُعطي التعبير عن الأصوات المختلفة في اللغة الإنجليزية. على سبيل المثال، يُعطى (b و f و p و v) رقم الكود “1”، بينما يُعطى (d و t) رقم الكود “3”.

لبناء “Soundex” للكلمة كاملة، يتم الاحتفاظ بالحرف الأول ثم يتم إزالة جميع أصوات الحروف المتحركة بما في ذلك (h و w)، ثم أن هناك قواعد إضافية للتعامل مع التكرارات والحالات الخاصة الأخرى، والنتيجة هي (حرف + ثلاثة رموز رقمية للسلسلة الأصلية). هذا التمثيل المبسط للغة هو ما يجعل “Soundex ” والخوارزميات صوتية أخرى مماثلة لأداة قوية لمقارنة الكلمات.

محددات الخوارزميات الصوتية:

يمكن أن تكون الخوارزميات الصوتية مفيدة للغاية للبحث في المستندات ومطابقة البيانات. ومع ذلك، فإن لديهم قيودًا، من هذه القيود:

قيود الإدخال:

هناك مدخلات معينة يمكن أن تُشكل تحدي للخوارزمية، ومنها:

  • الاعتماد على الحرف الأول: عادةً ما تبني الخوارزميات الصوتية رمزًا بناءً على الحرف الأول من الكلمة. يمكن بسهولة إيجاد كلمات ذات أحرف مختلفة لنفس الصوت، مثل “Katherine” هي (Soundex: K365)، و”Catherine” هي (Soundex: C365).
  • الحد الأقصى لعدد الأحرف في كود “Soundex” هو أربعة، وهذا يعني أن الكلمات الأطول يمكن أن تشترك في نفس الرمز، حتى لو كانت نوعًا ما مختلفة.
  • في الواقعي، غالبًا ما تستخدم الأحرف الأولى بدلاً من الاسم الكامل، مثل “JK Rowling” بدلاً من “Joanne Rowling”. تكافح الخوارزمية الصوتية لمطابقة هذين الاسمين.
  • عدم القدرة على تحمل الأخطاء المطبعية: الخوارزميات الصوتية ليست مرنة بطبيعتها لأخطاء الكلمات المطبعية التي يتم إدخالها الى قاعدة البيانات، قد يتم تحديد بعض الأخطاء المطبعية مثل “Carl” بدلاً من “Cral”، ولكن الأخطاء المطبعية مثل “geoge” بدلاً من “george” تؤدي إلى نتائج مختلفة تمامًا.

القضايا الثقافية:

تم تصميم الخوارزميات الصوتية في لغة معينة. تشمل التحديات الثقافية ما يلي:

  • ما يعادل الأسماء أو الألقاب. على سبيل المثال، قد يتم تبديل بين “Jack” و “John”
  • ترتيب الاسم: لا تستخدم جميع الثقافات ترتيب الاسم (الأول والأوسط والأخير). يمكن أن يؤدي عدم الاتساق في كيفية تسجيلها في قاعدة بيانات إلى تضليل الخوارزمية الصوتية بسهولة.
  • غالبًا ما توجد حروف ساكنة صامتة في الكلمة (لم يتم تسجيل هذه الأسماء بشكل ثابت في سجلات الأسماء ذات الأهمية). على سبيل المثال، “Dayton” و “Deighton”، أو “Cryton” و “Crighton”. ستؤدي الاختلافات في كيفية تسجيل هذه الأسماء إلى إرباك الخوارزمية الصوتية.
  • الاختلافات في التهجئة اللاتينية، يمكن أن يكون هناك عدد من الطرق لكتابة الأسماء أو تهجئتها باستخدام الأحرف اللاتينية والأصوات الإنجليزية، وأيضًا يمكن أن ينشأ هذا الاختلافات في السمع أو الفهم. وغالبًا ما يتم إدخال الأسماء في قاعدة البيانات بعد الاستماع إلى شخص يقول اسمه، حيث يمكن أن يضيف ذلك مزيدًا من التعقيدات إذا نُطق الاسم بطريقة غير واضحة.

قيود العملية:

هناك أيضًا بعض القيود على كيفية عمل الخوارزميات الصوتية:

  • العوائد (Returns) غير المرتبة: لا تحتوي الخوارزميات الصوتية عادة على أي مفهوم لترتيب الكلمات، الشيء الوحيد المهم هو أن الكلمات المشفرة هي نفسها الكلمات المنطوقة. غالبًا ما يكون من المفيد معرفة الكلمات المرتجعة الأقرب لمصطلح البحث.
  • تعتبر الدقة ضعيفة: يمكن للتأثيرات البسيطة على الخوارزميات الصوتية من نوع “Soundex” أن يبالغ في تبسيط الأسماء لدرجة أن التقنية تفقد فائدتها. سيظهر إدخال بعض الأسماء المشفر بسرعة على “Soundex ” أن العديد من الأسماء التي يتم إرجاعها ليست ذات الصلة. وهذا يضعف كفاءة أي عمليات بحث أو معالجة للبيانات.

شارك المقالة: