اقرأ في هذا المقال
- ما هو نوع وسائط الإنترنت؟
- أساسيات نوع وسائط الإنترنت
- تنسيقات نوع الوسائط في البيانات المفتوحة المرتبطة
- تطبيقات على نوع وسائط الإنترنت
- مشكلات نوع وسائط الإنترنت
إنّ تعريف ملف يعتمد على نظام ترميز “MIME”، وكان نوع وسائط الإنترنت المعروف سابقاً باسم “نوع MIME” هو المعيار الفعلي لتحديد المحتوى على الإنترنت، فعلى سبيل المثال لتحديد نوع المرفق المرسل في رسالة بريد إلكتروني يتم تضمين نوع الوسائط الخاص به في رأس الرسالة، وترسل خوادم الويب نوع الوسائط إلى المستعرض الذي يطلبه حتى يتمكن من تشغيل التطبيق المساعد المناسب أو المكون الإضافي.
ما هو نوع وسائط الإنترنت؟
نوع وسائط الإنترنت: يسمى في الأصل نوع “MIME”، وهي ملحقات بريد الإنترنت متعددة الأغراض وأحياناً نوع المحتوى بعد اسم الرأس في عدة بروتوكولات تكون قيمتها من هذا النوع، وهو معرف من جزأين لتنسيقات الملفات على الإنترنت، كما تم تعريف المعرفات في الأصل في “RFC 2046” للاستخدام في البريد الإلكتروني المرسل عبر “SMTP“، ولكن تم توسيع استخدامها ليشمل بروتوكولات أخرى مثل “HTTP” و”RTP” و”SIP”.
- “HTTP” هي اختصار لـ “Hypertext Transfer Protocol”.
- “SMTP” هي اختصار لـ “Simple Mail Transfer Protocol”.
- “RTP” هي اختصار لـ “Real-time Transport Protocol”.
- “SIP” هي اختصار لـ “Session Initiation Protocol”.
- “MIME” هي اختصار لـ “Multipurpose Internet Mail Extensions”.
أساسيات نوع وسائط الإنترنت:
نوع المحتوى له نوع ونوع فرعي مفصول بشرطة مائلة فعلى سبيل المثال “نص / عادي” و”صورة / gif” والأنواع الرئيسية هي التطبيقات والصوت والصورة والنصوص والفيديو، كما يشير التطبيق إلى مجموعة متنوعة من الأشكال، فعلى سبيل المثال يشير “application / x-pdf” إلى مستندات “Adobe Acrobat” ويشير “application / octet-Stream” إلى ملف “.EXE”.
يتكون نوع وسائط الإنترنت من جزأين هما اسم النوع واسم النوع الفرعي، واسم النوع هو واحد من تسع فئات ممكنة لتنسيق الملف، ويحدد النوع الفرعي تنسيق الملف نفسه، كما أنّها تشكل نوع وسائط الإنترنت في بناء الجملة “النوع / النوع الفرعي”، والأنواع الفرعية التي تبدأ بـ “vnd.” خاصةً بالبائع والأنواع الفرعية التي تبدأ بـ “x-” غير مسجلة في “IANA”.
تنسيقات الملفات المشتقة من تنسيق قياسي أو تنسيق ملف آخر على سبيل المثال لغة التوصيف الموسعة تأتي مع علامات الجمع “+”، فعلى سبيل المثال تنتهي بعض أسماء الأنواع الفرعية بـ “+ xml” ممّا يدل على أنّ التنسيق هو تنسيق “XML” .
يتكون نوع الوسائط من جزأين على الأقل هما نوع ونوع فرعي وواحد أو أكثر من المعلمات الاختيارية وعلى سبيل المثال، تحتوي الأنواع الفرعية للنص على معلمة مجموعة أحرف اختيارية يمكن تضمينها للإشارة إلى ترميز الأحرف، مثل “نص / html” ومجموعة أحرف “= UTF-8″، وغالباً ما تحدد الأنواع الفرعية من النوع متعدد الأجزاء حداً بين الأجزاء، ويتم تحديد قيم مجموعة الأحرف المسموح بها في قائمة مجموعات أحرف “IANA”.
“MIME” هو اختصار لعبارة ملحقات بريد الإنترنت متعددة الأغراض، وهي مواصفات لتنسيق الرسائل بخلاف “ASCII” بحيث يمكن إرسالها عبر الإنترنت، ويدعم الكثير من عملاء البريد الإلكتروني الآن “MIME” والتي تتيح لهم إرسال واستقبال ملفات الرسومات والصوت والفيديو عبر نظام بريد الإنترنت.
هناك العديد من أنواع الوسائط المحددة مسبقًا، مثل ملفات رسومات “GIF” وملفات “PostScript” ومن الممكن تحديد أنواع الوسائط المخصصة، وبالإضافة إلى تطبيقات البريد الإلكتروني تدعم متصفحات الويب أيضاً أنواع الوسائط المختلفة، ويتيح ذلك للمتصفح عرض أو إخراج ملفات ليست بتنسيق “HTML”، وتُعد مواصفات نوع الوسائط معلومات مهمة لمحركات البحث لتصنيف ملفات البيانات على الويب.
تنسيقات نوع الوسائط في البيانات المفتوحة المرتبطة:
نوع الوسائط: هو معرف لتنسيقات الملفات على سبيل المثال “نص / html” على الإنترنت يتألف من جزأين، هما سجل “نص” وسجل “html”، كما يتم التعامل معها من قبل هيئة الإنترنت للأرقام المخصصة “IANA”، وهي السلطة الرسمية لتوحيد ونشر هذه التصنيفات.
تم حجز هذه المساحة لتوفير وصف في “RDF”، وفقاً لأنطولوجيات النشر والمراجع الدلالية “SPAR” وشروط دبلن كور للبيانات الوصفية، لجميع أنواع الوسائط المتاحة على صفحة الويب الرسمية لـ “IANA” ويمكن الوصول إلى تمثيل “RDF” لكل نوع من أنواع الوسائط عن طريق ربط عنوان، ويمكن أن يكون كل نوع وسائط مصحوباً بوكلاء يعملون كمساهمين ووثائق “RFC” ذات الصلة التي توثقها، وحالتها الحالية سواء كانت رسمية أو مهملة أو قديمة وروابط مباشرة لصفحات ويكيبيديا وموارد “DBpedia” المتعلقة بنوع الوسائط.
بينما يتم التعامل مع الوصول إلى هذه الموارد بالتنسيق المطلوب عن طريق نهج التفاوض المعتاد على المحتوى، فمن الممكن أيضاً الوصول مباشرة إلى التمثيل المعين لنوع الوسائط عن طريق إضافة أحد الامتدادات التالية في نهاية “IRI” الخاص به:
- “.rdf for having the data in RDF/XML”.
- “.ttl for having the data in Turtle”.
- “.json for having the data in JSON-LD”.
- “.html for having the data in HTML”.
يمكن استخدام كل هذه الموارد التي تحدد أنواع الوسائط لتحديد تنسيقات معينة فعلى سبيل المثال عن طريق “DCTerms property dcterms: format” التي يمكن أن يمتلكها كيان معين، مثل كتاب أو مجموعة بيانات.
تطبيقات على نوع وسائط الإنترنت:
1- نزع “application/octet-stream – generic stream of allow with size of 8-bits”:
- “application/javascript”.
- “application/pdf”.
- “application/xhtml+xml”.
- “application/xml”.
- “application/xml-dtd”.
- “application/zip”.
2- الصوت:
صوت “/ mpeg”، حيث يتضمن “MP3” والتنسيقات الأخرى المستندة إلى “MPEG”.
3- الصورة:
- “image/jpeg”.
- “image/gif”.
- “image/png”.
4- رسالة:
هذه هي المواصفات المستخدمة لترحيل الرسائل بين أجهزة الكمبيوتر “message/http”.
5- نموذج:
هذه نماذج ثلاثية الأبعاد.
6- متعدد الأجزاء:
هذه هي البروتوكولات المستخدمة لتحديد الكائنات التي تتكون من أجزاء أو تنسيقات متعددة.
7- نص:
التنسيقات المستندة إلى النص التي يمكن استخدامها لتقديم المعلومات إلى البشر بما في ذلك التعليمات البرمجية المصدر والنصوص القابلة للقراءة والدلالات المفهومة.
- “text/html”.
- “text/css”.
- “text/csv”.
8- فيديو:
- “video / mp4” أي فيديو “MP4”.
- فيديو / كويك تايم أي فيديو “كويك تايم”.
مشكلات نوع وسائط الإنترنت:
المشكلة هي قدرة التطبيق المصدر أي خادم الويب وعميل البريد الإلكتروني على تحديد نوع وسائط الإنترنت بشكل صحيح لجزء من المحتوى، وتحاول العديد من التطبيقات تصنيف الملف بطريقة استكشافية باستخدام امتداد اسم الملف الخاص به أو باستخدام أرقام سحرية “Magic Numbers”، ولا يعتبر أي من الأسلوبين مثالياً، وقد يصنف نوع وسائط المحتوى بشكل غير صحيح:
- ملحق اسم الملف غير صحيح، وسيُبلغ مصنف امتداد اسم الملف عن نوع وسائط غير صحيح فعلى سبيل المثال تعطي بعض التطبيقات بشكل غير صحيح ملفات تنسيق النص المنسق امتدادات ملف “.doc” بدلاً من امتداد “.rtf” الصحيح.
- لا يوجد امتداد لاسم الملف، ولن يقوم مصنف امتداد اسم الملف بالإبلاغ عن أي نوع وسائط أو سوف يقوم بشكل غير صحيح بالإبلاغ عن نوع شامل مثل التطبيق أو دفق الثماني، والملفات بدون امتداد شائعة في أنظمة يونكس.
- تضاربات امتداد اسم الملف، وعندما تستخدم تنسيقات متعددة نفس امتداد اسم الملف سيختار مصنف امتداد اسم الملف نوع وسائط واحداً بشكل عشوائي، فعلى سبيل المثال تستخدم كل من قوالب “Microsoft Word” وملفات الرسم البياني “Graphviz” الامتداد “.dot”.
- تنسيقات حاوية غامضة، وقد يعطي مصنف الأرقام السحري نوع وسائط صحيحاً وإن كان غير محدد وبالتالي يمنع تفسيراً ذا مغزى للمحتوى، فعلى سبيل المثال يتم تنفيذ تنسيق “Office Open XML (.docx)” و”Java” القابل للتنفيذ “.jar” داخلياً كأرشيف مضغوط، وقد يصنف نظام الأرقام السحري مثل هذه الملفات مثل التطبيق أز الرمز البريدي بدلاً من النوع الأكثر تحديداً وتحدث مشكلات مماثلة بين “XML” وتنسيقات التطبيق المطبقة أعلى “XML”.
- أرقام سحرية غامضة، ويمكن للمهاجم إنشاء ملف يتم تحديده في وقت واحد على أنّه نوعين منفصلين من وسائط الإنترنت، وعلى سبيل المثال البنية الداخلية لـ “Gifar” تجعلها صورة “GIF” صالحة و”Java” قابلة للتنفيذ.