في عصر التكنولوجيا الرقمية المتقدمة والسريعة، أصبحت البيانات تحيط بنا من كل جانب ومتواجدة في كل مكان من حولنا، ويحدث هذا نتيجة الاستخدام المتزايد للإنترنت والتقنيات بشكل كبير وهائل من حول العالم، حيث يزداد حجم البيانات الرقمية في عالمنا ويتزايد تأثيرها في تغيير حياتنا بسرعة كبيرة ويتضاعف هذا الحجم كل عام.

مفهوم تحليل البيانات الضخمة:

حيث تقول دراساتٌ قامت بها فوركس بأنه سيتم إنشاء ورفع حوالي 1.7 ميجابايت من المعلومات الجديدة في كل ثانية تمر من حياة كل إنسانٍ على وجه الأرض، ممّا يجعل مجال البيانات يتطور بشكلٍ كبيرٍ ويرتفع شأنه وأهميته في مستقبل عالمنا وحياتنا، واليوم سوف نستطلع على من علوم البيانات وكذلك تحليل البيانات الضخمة وغيرها من الأمور التي تتعلق بهذا الموضوع.

يقصد به استخدام تقنيات تحليلية متقدمة لتحليل وفهم مجموعات ضخمة وكبيرة من البيانات التي تختلف في أشكالها وأنواعها، وهذا العلم أو المجال مهم جداً في تحليل البيانات المهيكلة وشبه المهيكلة وغير المهيكلة القادمة من مختلف مصادر وبأحجام مختلفةمن التيرابايت (Terabyte) وصولًا إلى الزيتابايت (Zettabyte)، وكما توفر هذه العملية فرصة للباحثين والمحللين وأصحاب الأعمال الكبرى لاتخاذ قرارات أفضل وأسرع. وبذلك يعتبر تحليل البيانات هو أحد العلوم التي تشكل الركيزة الأساسية لعلوم الكمبيوتر والهندسة التقنية وهندسة البرمجيات ويتم تدريسه على نطاق واسع في الجامعات الأكاديمية في عصرنا.

مفهوم البيانات الضخمة:

إنه مصطلح حديث يُطبّق على أي مجموعة من البيانات التي تكون كبيرة الحجم؛ ممّا يصعب على قواعد البيانات التقليدية العثور عليها في أجهزة الكمبيوتر العادية؛ لمعالجتها أو إدارتها أو التعامل معها أو الاستجابة لها بسرعة كما هو الحال في التعامل مع البيانات الأصغر حجماً، حيث تحتوي البيانات الضخمة على العديد من التعقيدات والخصائص التي يصعب تحليلها على أجهزة الكمبيوتر العادية.

وتتمثل هذه الخصائص بالحجم الكبير والتنوع الكبير في أنواع ومصادر هذه البيانات، ويتم إنتاجها من أجهزة الاستشعار وأجهزة الفيديو والصوت، وكما يتم تصدير هذه البيانات عن طريق الشبكات والإنترنت ومواقع التواصلالإجتماعي، فهي تنتشر على نطاق واسع في الوقت الحاضر.

تاريخ تحليل البيانات الضخمة:

إنّ مبدأ البيانات الضخمة وتحليلها متوافر خلال العديد من السنوات الماضية، ومن ذلك في خمسينيات القرن الماضي وقبل أن يكون مُصطلح البيانات الضخمة متوافر أو معروف في العالم، حيث كانت الشركات تستخدم التحليل البسيط من خلال أساسيات التحليل التي تعتمد على الأرقام وجداول بيانات التحليل بشكلٍ يدويٍ، وغالبًا ما كانت تستهلك هذه العملية من التحليل الكثير من الوقت للقيام بها، كما أنها تكشف القليل من البيانات فقط وتعطي نتائجَ بسيطةً نوعًا ما.