تنسيق ترميز الصوت - mpeg audio coding standard

اقرأ في هذا المقال


مع ظهور الأجهزة التي توحد العديد من الوظائف، زادت الصناعة طلباً على برنامج ترميز صوتي يمكنه التعامل بشكل جيد مع جميع أنواع المحتوى الصوتي، ففي أوائل عام 2012م أنهت (ISO MPEG) المعيار الجديد لترميز الصوت والكلام الموحد (MPEG-D)، والذي يجمع بين عوالم منفصلة سابقاً من الصوت العام وتشفير الكلام حيث يقوم بذلك عن طريق دمج عناصر من تشفير الصوت وتشفير الكلام في نظام موحد عبر نطاق واسع من معدلات البت.

ما هو الترميز الصوتي – mpeg audio coding standard؟

الترميز الصوتي (mpeg audio coding): هو ترميز تمثيل المحتوى لتخزين أو نقل الصوت الرقمي، مثل التلفزيون الرقمي والراديو الرقمي وملفات الصوت والفيديو، ويطلق عليه تنسيق ترميز الصوت.

تتضمن أمثلة تنسيقات ترميز الصوت (MP3 وAAC وVorbis وFLAC وOpus)، كما يُطلق على برنامج معين أو تطبيق أجهزة قادر على ضغط الصوت وإلغاء ضغطه إلى أو من تنسيق ترميز صوتي محدد اسم برنامج ترميز الصوت؛ مثال على برنامج ترميز الصوت هو (LAME) وهو واحد من عدة برامج ترميز مختلفة تقوم بتنفيذ تشفير وفك تشفير الصوت بتنسيق ترميز الصوت (MP3) في البرنامج.

تاريخ ظهور معايير ضبط الصوت – mpeg audio coding standard:

بعد إدخال تقنيات الفيديو الرقمي وتنسيق القرص المضغوط في منتصف الثمانينيات، بدأت سلسلة من التطبيقات التي تضمنت تقنيات الصوت أو الفيديو الرقمية والوسائط المتعددة في الظهور حيث أدت الحاجة إلى إمكانية التشغيل البيني وصورة عالية الجودة مصحوبة بصوت بجودة الأقراص المضغوطة بمعدلات بيانات منخفضة.

ولتنسيق ملف مشترك إلى إنشاء مجموعة قياسية جديدة داخل اللجنة الفنية المشتركة لتكنولوجيا المعلومات (JTC 1) برعاية المنظمة الدولية للتوحيد القياسي (ISO) والهيئة الكهروتقنية الدولية (IEC) تم إنشاء هذه المجموعة، مجموعة خبراء الصور المتحركة (MPEG) في نهاية الثمانينيات مع تفويض لتطوير معايير للتمثيل المشفر للصور المتحركة والصوت المرتبط بها وتركيبها (Chiariglione 95).

يتم تطوير المعايير للسماح لمختلف المصنعين ببناء وبيع المكونات المتوافقة حيث طورت المنظمة الدولية للتوحيد القياسي (ISO) معياراً لضغط الصوت الرقمي عالي الجودة، كما أنّ معيار التشفير (ISO MPEG-1) هو مخطط تشفير يقدم ثلاث طبقات من الضغط، كما أنتجت منظمة (MPEG) عدداً من معايير الوسائط الرقمية منذ إنشائها في عام 1998م.

طبقات معايير ترميز الصوت:

يمكن النظر إلى الطبقات على أنّها مخطط ضغط متميز مع زيادة التعقيد والتأخير والأداء الذاتي حيث تدمج الطبقات العليا اللبنات الأساسية للطبقات السفلية حيث يدعم صوت (MPEG-1) معدلات أخذ العينات (32 و44.1 و48 كيلو هرتز) ومعدلات البت بين (32 كيلوبت / ثانية أي أحادية و448 كيلوبت / ثانية أي الطبقة الأولى ستيريو أو 384 كيلوبت / ثانية أي ستيريو الطبقة الثانية).

يحتوي صوت (MPEG-1) على أربعة أوضاع: أحادي ، وستيريو ، وثنائي بقناتين منفصلتين وهو مفيد للبرامج ثنائية اللغة وستيريو مشترك، ففي وضع الاستريو المشترك الاختياري يتم استغلال التبعيات بين القنوات لتقليل معدل البت الكلي باستخدام تقنية تقليل لا فائدة منها تسمى ستريو الكثافة و في هذا الوضع يتم إرسال مجموع (L+R) للإشارة اليمنى واليسرى فقط بترددات عالية، جنباً إلى جنب مع عوامل مقياس الكم.

يصف الجزء المعياري من المعيار مفكك التشفير ومعنى تدفق البتات المشفر وهو مجال للتحسين غير التطوري لبرنامج التشفير حيث يمكن استخدام نماذج صوتية نفسية مختلفة تتراوح من النماذج البسيطة جداً إلى النماذج المعقدة جداً، كما يمكن تحسين المشفر لتطبيق معين ويمكن استخدام جميع أجهزة التشفير بتوافق كامل مع وحدات فك التشفير (MPEG-1) الحالية.

1. طبقة الأولى MPEG-1:

  • يحتوي التعيين الأساسي لمدخل الصوت الرقمي على (32 نطاقاً) فرعياً عبر مرشحات تمرير النطاق المتباعدة بشكل متساوٍ أي مجموعة في حالة 512 نقراً على مرشحات (FIR) وتكون أطوال الكتلة الثابتة تقريباً (8 مللي ثانية) عند تردد أخذ العينات (48 كيلوهرتز)، والتكميم مع كتلة (companding) توفير نطاق ديناميكي كبير جداً أكثر من (120 ديسيبل).
  • يتم تشكيل كتل من (12 عينة) هالكة في كل نطاق فرعي حيث يتم حساب نسب الإشارة إلى الكتلة (SMR) لكل كتلة عبر (512 نقطة FFT)، كما يتم اختار خوارزمية تخصيص البتات مُكمِّمًا (من مجموعة من 15) ويتم استيفاء شرط معدل البت، كذلك يتم إخفاء ضوضاء التشفير قدر الإمكان.
  • فك التشفير يكون واضح ومباشر حيث يتم إعادة بناء تسلسلات النطاق الفرعي على أساس كتل النطاق الفرعي المكونة من (12 عينة) مع مراعاة عامل التدرج المتناثر ومعلومات تخصيص البت، فإذا لم يكن للنطاق الفرعي بتات مخصصة له يتم تعيين العينات على الصفر. في كل مرة يتم فيها حساب عينات النطاق الفرعي لجميع النطاقات الفرعية البالغ عددها (32) يتم تطبيقها على بنك التصفية التجميعي ويتم حساب (32 عينة) صوتية متتالية بتنسيق (PCM) أي (16 بت).
  • في الاختبارات الرسمية (ISO / MPEG) أظهر ترميز الطبقة الأولى أداءً ممتازاً بمعدل بت ستريو يبلغ (384 كيلوبت / ثانية).

2. الطبقة الثانية MPEG-1:

  • يشبه بشكل أساسي مبرمج الطبقة الأولى ولكنّه يحقق أداءً أفضل من خلال ثلاثة تعديلات حيث يكون المدخل إلى النموذج الصوتي هو (1024 نقطة FFT) ممّا يؤدي إلى دقة تردد أدق لحساب عتبات الإخفاء العالمية، كما يتم تقليل المعلومات الجانبية لعامل التحجيم الكلي من خلال استغلال التكرار بين عوامل التدرج لثلاث كتل متجاورة مكونة من (12 عينة) ممّا يؤدي إلى توفير تكميم أدق.
  • في الاختبارات الرسمية (ISO / MPEG) أظهر ترميز (Layer II) أداءً ممتازاً بمعدل بت ستريو (256 كيلو بت / ثانية) وعند استخدام ستريو مشترك يكون (192 كيلو بت / ثانية).

3. الطبقة الثالثة MPEG-1:

تشفير هجين أي نطاق فرعي أو تحويل وهي الطبقة الوحيدة التي توفر تشفيراً بمعدل بتات متغير حيث أنّ الطبقة الثالثة حسنت تعيين التردد لنهج التحليل بالتوليف لتخصيص البتات وتحكم مسبق متقدم، وتستخدم الطبقة الثالثة تكميماً غير منتظم مع ترميز إنتروبيا.

لتحقيق دقة تردد أعلى أقرب إلى أقسام النطاق الحرج تنقسم إشارات النطاق الفرعي البالغ عددها (32 إشارة) إلى مزيد من الانقسام في محتوى التردد عن طريق تطبيق (DCT) معدل من ست نقاط أو 18 نقطة (MDCT) مع تداخل بنسبة (50%) لكل نطاق فرعي، كما يتم تطبيق (MDCT) المكون من ست نقاط في حالة الصدى المسبق المتوقع.

الحد الأقصى لعدد مكونات التردد هو (32 * 18 = 576) يمثل كل منها عرض نطاق (24000/576 = 41.67 هرتز فقط)، وعند معدل بتات مجسم يبلغ (1128 كيلوبت / ثانية) أعطت الاختبارات الذاتية (ISO / MPEG) زيادة في درجة الانحطاط بنحو 0.6 على الطبقة الثانية.

4. ترميز MPEG-2 متعدد القنوات:

  • المرحلة الثانية من (MPEG) تسمى (MPEG-2) حيث يتضمن في الجزء الصوتي الخاص به معيارين لتشفير الصوت متعدد القنوات؛ أحدهما متوافق مع (MPEG-1) للأمام والخلف ومتوافق مع (MPEG-1)، كما يمكن لمفكك الشفرة متعدد القنوات فك تشفير إشارات (MPEG-1) أحادية أو ستيريو بشكل صحيح، ومتوافق مع الإصدارات السابقة مع (MPEG-1). كما يمكن لوحدة فك ترميز الصوت المجسم (MPEG-1) أن تقدم إشارة مجسم صحيحة إمّا أمامية يسار وأمامي يمين عند فك تشفير تيار بتات متعدد القنوات (MPEG-2) مستقبلي أي أنّ مفكك الشفرة سيعيد إنتاج مزيج تنازلي ذي مغزى من الخمسة الأصلية قناة.
  • ترميز (MPEG-2) المتوافق حيث يشير التوافق العكسي إلى استخدام مصفوفات التوافق وينتج عن مزيج تنازلي للقنوات الخمس أي المصفوفة إشارتين مجسمتين متوافقتين حيث يتحقق التوافق العكسي عن طريق إرسال إشارات التمديد متعددة القنوات في مجال الطول المتغير لـ قطار بتات (MPEG-1) محجوز للبيانات المساعدة، والتي يتم تجاهلها بواسطة مفكك الشفرة (MPEG-1). وإذا تم استخدام المصفوفة في اتصال مع التشفير الحسي فقد يظهر إلغاء القناع لضوضاء التكميم، كما قد يكون سبب ذلك في عملية إزالة التشبيك عندما يتم تضمين إشارات الجمع والفرق حيث يمكن أن يختفي مكون إشارة المجموع أو الفرق الذي يفترض أن يخفي ضوضاء التكميم.
  • ترميز (MPEG-2) الغير متوافق حيث يدعم المعيار الثاني الذي يتضمن (MPEG-2) التطبيقات التي لا تطلب التوافق مع تنسيق الستيريو الحالي (MPEG-1)، وتكون المصفوفة و(DE matrix) ليست ضرورية أي تختفي القطع الناتجة المحتملة المقابلة، كما سيحتوي وضع التشفير متعدد القنوات (NBC) على معدلات أخذ العينات وعرض النطاق الترددي الصوتي وتكوينات القنوات للصوت MPEG-2، ولكن يجب أن يكون قادراً على العمل بمعدلات بتات من (32 كيلو بت / ثانية) حتى معدل بتات كافٍ للصوت عالي الجودة.

يشير اسم (MPEG-4) عالي الكفاءة (AAC HE-AAC) إلى مجموعة من مشفرات الصوت الحديثة التي طورتها المنظمة الدولية للتوحيد القياسي أي اللجنة الكهروتقنية الدولية (ISO / IEC) مجموعة خبراء الصور المتحركة (MPEG) بالتمديد اللاحق من بنية التشفير الصوتي المتقدم (AAC) حيث تسهل هذه الامتدادات الخوارزمية زيادة كبيرة في كفاءة التشفير مقارنة بالمعايير السابقة والأنظمة المعروفة الأخرى.

وبالتالي، فإنّها توفر تمثيلاً لإشارات الصوت أو الموسيقى العامة التي توفر جودة صوت عالية أيضاً للتطبيقات المحدودة في عرض النطاق الترددي للإرسال أو سعة التخزين، مثل البث الصوتي الرقمي والوصول اللاسلكي إلى الموسيقى للهواتف الخلوية.

باستخدام ضغط (MPEG) يمكن تقليل حجم ملف الوسائط المتعددة بشكل ملحوظ مع فقدان قليل ملحوظ في الجودة وهذا يجعل نقل الملفات عبر الإنترنت أكثر كفاءة، ممّا يساعد على الحفاظ على النطاق الترددي للإنترنت، كما يُعد ضغط (MPEG) في كل مكان بحيث يستخدم مصطلح (MPEG) بشكل شائع للإشارة إلى ملف فيديو محفوظ بتنسيق ملف (MPEG) وعادةً ما يكون لهذه الملفات ملحق ملف (mpg) أو (mpeg).


شارك المقالة: