برنامج ترميز الصوت - GSM / Vocoder

اقرأ في هذا المقال


في أي جهاز إرسال واستقبال اتصال، يُعد برنامج الترميز (Coder / Decoder) أحد اللبنات الأساسية لنقل البيانات بكفاءة، كما يرتبط تشفير المصدر باستخدام أكواد متغيرة الطول لتقليل الرموز إلى صورة مجردة وذلك لتمثيل المعلومات في الرسالة المرسلة، حيث يقلل ضغط البيانات بدون فقدان وحدات البت عن طريق تحديد التكرار الإحصائي والقضاء عليه.

أساسيات المشفر الصوتي أو برنامج الترميز:

تطورت تقنية ترميز الصوت بدرجات كبيرة في السنوات الأخيرة نتيجةً لزيادة قوة المعالجة المتاحة، ممّا يعني أنّ برامج الترميز الصوتية المستخدمة في نظام (GSM) لها تحسينات كبيرة منذ طرح هواتف (GSM) الأولى.

تقوم برامج ترميز الصوت والمشفرات الصوتية بتحويل الإشارات الصوتية المطلوبة لإرسالها عبر ارتباط (GSM) إلى تنسيق رقمي مضغوط، بحيث تتضمن تقنيات ترميز الصوت المستخدمة مع (GSM) تقنيات (LPC-RPE) و(EFR) والمعدل الكامل ونصف المعدل وترميز (AMR) وترميز (AMR-WB) و(CELP) و(ACELP) و(VSELP) وتقنيات ترميز الكلام.

تُستخدم مشفرات الصوت أو برامج ترميز الكلام في العديد من مجالات الاتصالات الصوتية، حيث إذا تم رقمنة الكلام بطريقة خطية، فسيتطلب ذلك معدل بيانات مرتفعاً يشغل نطاقاً ترددياً عريضاً جداً؛ ولأنّ النطاق الترددي يكون عادةً محدوداً في أي نظام اتصالات، فمن الضروري ضغط البيانات لإرسالها عبر القناة المتاحة، وبمجرد مرورها عبر القناة يمكن توسيعها لإعادة إنشاء الصوت بطريقة أقرب ما يمكن من الصوت الأصلي.

تتوفر مجموعة متنوعة من الأشكال المختلفة لبرنامج ترميز الصوت أو مشفر الصوت للاستخدام العام، كما حيث يدعم نظام (GSM) عدداً من برامج ترميز الصوت المحددة، كما تتضمن هذه البرامج ترميز (RPE-LPC) ونصف المعدل و(AMR)، بحيث يختلف أداء كل برنامج ترميز صوتي ويمكن استخدامه في ظل ظروف مختلفة، كما يتم إدخال برنامج الترميز الأحدث (AMR) واسع النطاق (AMR-WB) في العديد من المجالات بما في ذلك (GSM).

وفقاً لمتطلبات نظام الترميز، يجب التقاط الكلام بمعدل عينة مرتفع بدرجة كافية ودقة للسماح بإعادة إنتاج الصوت الأصلي بوضوح، كما يجب بعد ذلك ضغطها بطريقة تحافظ على دقة الصوت عبر قناة إرسال لاسلكية بمعدل بتات محدودة وعرضة للخطأ.

يمكن أن تستخدم برامج ترميز الصوت أو المشفرات الصوتية مجموعة متنوعة من التقنيات، ولكن العديد من برامج ترميز الصوت الحديثة تستخدم تقنية تعرف باسم التنبؤ الخطي، كما يمكن تشبيه هذا بالنمذجة الرياضية للقناة الصوتية البشرية، ولتحقيق ذلك يتم تقدير الغلاف الطيفي للإشارة باستخدام تقنية التصفية، وحتى في حالة استخدام الإشارات مع العديد من الإشارات غير المتوافقة فمن الممكن أن تعطي برامج ترميز الصوت مستويات كبيرة جداً من الضغط.

منهجيات الترميز لبرامج ترميز GSM:

1. برنامج ترميز CELP:

الترميز الخطي المتحمس للتنبؤ الخطي (CELP): هو عبارة عن خوارزمية مشفر صوتي تم اقتراحه في الأصل في عام 1985م، بحيث أعطى تحسيناً كبيراً على برامج الترميز الصوتية الأخرى في ذلك اليوم، وتم تطوير المبدأ الأساسي لبرنامج ترميز (CELP) واستخدامه كأساس لبرامج ترميز الصوت الأخرى بما في ذلك (ACELP) و(RCELP) و(VSELP)، كما تُعد منهجية (CELP) الترميز الآن أكثر خوارزمية ترميز الكلام استخداماً، بحيث يتم استخدامه كمصطلح عام لفئة معينة من مشفرات الصوت أو برامج ترميز الكلام وليس برنامج ترميز معين.

يُعد الهدف الرئيسي من برنامج الترميز (CELP) هو أنّه يستخدم مبدأ يعرف باسم التحليل بالتوليف، وفي هذه العملية يتم تنفيذ الترميز عن طريق التحسين الإدراكي للإشارة المفكوكة في نظام الحلقة المغلقة، كما تتمثل إحدى الطرق التي يمكن من خلالها تحقيق ذلك في مقارنة مجموعة متنوعة من تدفقات البتات المتولدة واختيار تلك التي تنتج أفضل إشارة صوتية.

2. برنامج ترميز ACELP:

برنامج ترميز التنبؤ الخطي المتحمس (ACELP): هو كود جبري، وتُعد خوارزمية المشفر الصوتي تطوراً لنموذج (CELP)، كما إنّ دفاتر ترميز (ACELP) لها بنية جبرية محددة.

3. برنامج ترميز VSELP:

تُعد أحد العوائق الرئيسية لبرنامج ترميز (Vector Sum Excitation) هو قدرته المحدودة على ترميز الأصوات غير الكلامية، ممّا يعني أنّ أداؤه ضعيف في وجود الضوضاء، ونتيجةً لذلك لم يتم استخدام برنامج ترميز الصوت هذا على نطاق واسع الآن، حيث يتم تفضيل برامج ترميز الكلام الأحدث الأخرى والتي تقدم أداءً فائقاً.

أنظمة فك وتشفير الصوت GSM:

تم العمل على تأييد مجموعة متنوعة من برامج ترميز الصوت أو مشفر الصوت (GSM) وتم تقديمه في أوقات مختلفة ولها مستويات مختلفة من الأداء، وعلى الرغم من أنّ بعض برامج ترميز الصوت المبكرة لم يتم استخدامها على نطاق واسع هذه الأيام، إلّا أنّها لا تزال موصوفة لأنّها تشكل جزءاً من نظام (GSM).

1. برنامج الترميز الكامل لنظام GSM / RPE-LPC:

يُعد برنامج النبض المنتظم المنفعل والمبرمج التنبئي الخطي (RPE-LPC) بأنّه أول برنامج ترميز للكلام يستخدم مع (GSM)، وتم اعتماده بعد إجراء الاختبارات لمقارنته بأنظمة الترميز الأخرى في اليوم، كما يعتمد برنامج ترميز الكلام على إثارة النبض المنتظم مع التنبؤ طويل المدى.

يرتبط المخطط الأساسي ببرنامجي ترميز سابقين للكلام؛ وهما: (LPCMPE-LPC) و(MPE-LPC)، كما تتمثل مزايا (RELP) في التعقيد المنخفض نسبياً الناتج عن استخدام تشفير النطاق الأساسي، لكن أداءه مقيد بالضوضاء اللونية التي ينتجها النظام، حيث تُعد (MPE-LPC) أكثر تعقيداً ولكنّها توفر مستوى أفضل من الأداء، وقدم برنامج الترميز (RPE-LPC) حلاً وسطاً بين الاثنين، حيث حقق التوازن بين الأداء والتعقيد لتكنولوجيا ذلك الوقت.

على الرغم من العمل الذي تم القيام به لتوفير الأداء الأمثل مع تطور التكنولوجيا بشكل أكبر، كان يُنظر إلى برنامج الترميز (RPE-LPC) على أنّه يقدم مستوى ضعيفاً من جودة الصوت، ومع توفر برامج الترميز الصوتية ذات المعدل الكامل الأخرى تم دمجها في النظام.

2. برنامج ترميز المعدل الكامل المحسن – GSM EFR:

تمت إضافة مشفر صوتي آخر يسمى المشفر الصوتي المحسن المعدل الكامل (EFR) استجابةً للجودة الرديئة التي يراها مستخدمو برنامج الترميز الأصلي (RPE-LPC)، كما قدم برنامج الترميز الجديد هذا جودة صوت أفضل بكثير وتم اعتماده بواسطة (GSM)، أمّا باستخدام تقنية الضغط (ACELP) أعطت تحسناً ملحوظاً في الجودة مقارنة بمشفر (LPC-RPE) الأصلي، كما أصبح من الممكن مع زيادة قوة المعالجة التي كانت متوفرة في الهواتف المحمولة نتيجةً المستويات الأعلى من طاقة المعالجة إلى جانب استهلاكها الحالي المنخفض.

3. ترميز GSM بنصف معدل:

يسمح معيار (GSM) بتقسيم قناة صوتية واحدة كاملة المعدل إلى قناتين فرعيتين يمكنهما الاحتفاظ بمكالمات منفصلة، وعند القيام بذلك يمكن لمشغلي الشبكات مضاعفة عدد المكالمات الصوتية التي يمكن معالجتها بواسطة الشبكة باستثمارات إضافية قليلة جداً.

لتمكين استخدام هذا المرفق يجب استخدام برنامج ترميز بمعدل نصف، كما تم تقديم برنامج الترميز بنصف معدل في السنوات الأولى من نظام (GSM) ولكنّه أعطى جودة صوت أقل بكثير مقارنةً ببرامج ترميز الكلام الأخرى، ومع ذلك فقد أعطت مزايا عندما كان الطلب مرتفعاً وكانت سعة الشبكة مرتفعة.

يستخدم برنامج ترميز (GSM) بنصف المعدل خوارزمية ترميز (VSELP)، حيث يقوم بترميز البيانات حول إطار (20 مللي ثانية) تحمل كل منها (112 بتاً) لإعطاء معدل بيانات يبلغ (5.6 كيلوبت في الثانية)، كما يتضمن ذلك معدل بيانات (100 بت في الثانية) لمؤشر الوضع الذي يوضح ما إذا كان النظام يعتقد أنّ الإطارات تحتوي على بيانات صوتية أم لا، ويسمح ذلك لبرنامج ترميز الكلام بالعمل بطريقة توفر الجودة المثلى، وتم تقديم نظام الترميز بنصف المعدل في التسعينيات، ولكن لسوء الجودة الملحوظة لم يتم استخدامه على نطاق واسع.

4. برنامج ترميز GSM AMR:

يتميز برنامج الترميز المتكيف متعدد المعدلات (AMR) بأنّه أكثر ترميز (GSM) استخداماً، حيث تم اعتماد برنامج الترميز (AMR) من قبل (3GPP) في عام 1988م، ويستخدم لكل من (GSM) والمكالمات الصوتية (UMTS / WCDMA) بتبديل الدائرة، حيث يوفر برنامج ترميز (AMR) مجموعة متنوعة من الخيارات لواحد من ثمانية معدلات بت مختلفة.

تعتمد معدلات البت على الهياكل التي يبلغ طولها (20 مللي ثانية) وتحتوي على (160 عينة)، ويستخدم برنامج ترميز (AMR) مجموعة متنوعة من الأساليب المختلفة لتوفير ضغط البيانات، كما يتم استخدام برنامج ترميز (ACELP) كأساس لبرنامج ترميز الكلام العام، ولكن يتم استخدام تقنيات أخرى بالإضافة إلى ذلك، كما يتم استخدام الإرسال المتقطع بحيث يتم قطع الإرسال في حالة عدم وجود نشاط الكلام.

يتم استخدام اكتشاف النشاط الصوتي (VAD) للإشارة إلى وجود ضوضاء في الخلفية فقط وعدم وجود كلام، وبالإضافة إلى تقديم ملاحظات للمستخدم تفيد بأنّ الاتصال لا يزال موجوداً يتم استخدام مولد ضوضاء الراحة (CNG) لتوفير بعض ضوضاء الخلفية حتى في حالة عدم نقل بيانات الكلام، كما يضاف هذا محلياً في المتلقي.

يحتاج استخدام برنامج ترميز (AMR) إلى استخدام الوصلة المناسبة، كما يتم العمل على اختيار معدل البيانات الأمثل بعدف الحصول على متطلبات ظروف القناة الراديوية الحالية بما في ذلك نسبة الإشارة إلى الضوضاء وسعتها، ويتحقق ذلك بتقليل تشفير المصدر وزيادة تشفير القناة، وعلى الرغم من وجود انخفاض في وضوح الصوت إلّا أنّ اتصال الشبكة أكثر قوة ويتم الحفاظ على الارتباط دون انقطاع.

يمكن ملاحظة مستويات التحسن بين (4 و6 ديسيبل)، كما يمكن لمشغلي الشبكات تحديد أولويات كل محطة من حيث الجودة أو السعة، ويحتوي برنامج ترميز (AMR) على إجمالي ثمانية معدات: ثمانية منها متوفرة بسعر كامل بالفرنسية، وستة متاحة بنصف المعدل (HR)، ممّا يعطي ما مجموعه أربعة عشر وضعاً مختلفاً.

يعتمد ضغط البيانات على تعقيد الزمان والمكان، مثل درجة الضغط ومقدار التشويه المقدم أثناء استخدام ضغط البيانات المفقودة والموارد الحسابية المطلوبة لضغط وفك ضغط البيانات، كما يكمن مبدأ التصميم الأمثل لبرنامج الترميز في المساومة الدقيقة للمقايضة المذكورة والتي تهدف إلى الحفاظ على متطلبات جودة الخدمة.

المصدر: GSM Speech CodersGSM Audio Codec / VocoderGSM-AMR (AMR-NB) VocoderCodecs


شارك المقالة: