يتضمن توزيع البيانات إنشاء نسخ من البيانات وتوزيعها بين مجموعات أو أكثر من هياكل البيانات الجغرافية، بحيث يسمح بالعمل على نفس البيانات في مواقع منفصلة.
أسباب توزيع البيانات في عمليات التنقيب
- يتم توزيع البيانات كوسيلة لتحسين توافر البيانات والأداء من خلال التخفيف من حدة التنازع على الخادم وبطء وصول الشبكة إلى خادم مركزي.
- يمكن أن يساعد توزيع البيانات المؤسسة في موازنة الحمل على هياكل البيانات الجغرافية الموزعة الخاصة بها بين المستخدمين الذين يقومون بالتعديلات وأولئك الذين يصلون إليها لعمليات القراءة.
- يُعد توزيع البيانات مطلوبًا أيضًا لمستخدمي الهاتف المحمول أو المقاولين الذين يحتاجون إلى المشاركة في البيانات الجغرافية الخاصة بهم في الحقل لتحريرها وفصلها عن الشبكة تمامًا لفترة زمنية غير محددة.
- في حين أنّ بنية الخدمات المصغرة يمكن أن تساعد في تحويل التطبيقات القديمة إلى تطبيقات حديثة قابلة للتطوير فإنّ التحدي الآخر لتحديث التطبيقات هو تصميم نموذج بيانات موزعة يمكن أن تمتد إلى مراكز البيانات، وتوفر توفرًا عاليًا وتوفر قدرات عمليات على البيانات عالية الأداء.
- كما يتم توفير نظام تخزين وتحليلات قابل للتطوير ونموذجًا لتخزين مجموعات البيانات الكبيرة الموزعة، ويتم توزيع بنية البيانات والنظام، ممّا يعني أن البيانات يتم توزيعها عبر عقد متعددة، ويمكن أن تكون مجموعات عقد النظام هذه في مركز بيانات واحد أو يمكن أن تمتد عبر مراكز بيانات متعددة.
- بينما مهد النظام لإجراء تحليلات واسعة النطاق عبر مجموعات بيانات كبيرة وموزعة إلّا أنّه مناسب بشكل أفضل لمعالجة الدُفعات بدلاً من التحليل في الوقت الفعلي للبيانات غير المنظمة، وفجوة التخزين في الوقت الفعلي وتحليل البيانات عالية السرعة غير المنظمة وشبه الهيكلية والمنظمة.
- كما يتم تصميم مستودع المستندات لحفظ المستندات التي يتم تنسيقها عادةً كمستندات، مثل نماذج البيانات الموزعة المختلفة ولا يلتزم مخزن المستندات بمخطط محدد، وبدلاً من ذلك الهيكل داخلي للمستند نفسه.