Home > Posts > BigData > انواع وخصائص البيانات الضخمة

انواع وخصائص البيانات الضخمة

في الآونة الأخيرة كان مصطلح البيانات الضخمة تحت الأضواء، ولكن لا يعرف الكثير من الناس ما هي البيانات الضخمة. تعمل الشركات والمؤسسات الحكومية والصحية والمالية بالإضافة إلى المؤسسات الأكاديمية على الاستفادة من قوة البيانات لتعزيز آفاق الأعمال إلى جانب تحسين تجربة العملاء. تؤكد شركة IBM أن الشركات حول العالم تولد ما يقرب من 2.5 مليار بايت من البيانات يوميًا! تم إنتاج 90٪ تقريبًا من البيانات العالمية في العامين الماضيين فقط.

ما هي البيانات الضخمة

هي حجم كبير، وسرعة عالية، وأصول معلومات متنوعة تتطلب أشكالًا مبتكرة فعالة من حيث التكلفة لمعالجة المعلومات لتحسين الرؤية واتخاذ القرارات. “

يجيب هذا التعريف بوضوح عن السؤال “ما هي البيانات الضخمة ” – تشير البيانات الضخمة إلى مجموعات البيانات الكبيرة والمعقدة التي يجب معالجتها وتحليلها لكشف معلومات قيمة يمكن أن تفيد الشركات والمؤسسات.

مبادئ واساسيات البيانات الضخمة

  • تشير إلى كمية هائلة من البيانات التي تستمر في النمو مع مرور الوقت بشكل كبير.
  • ضخمة للغاية بحيث لا يمكن معالجتها أو تحليلها باستخدام تقنيات معالجة البيانات التقليدية.
  • تشمل استخراج البيانات وتخزين البيانات وتحليل البيانات ومشاركة البيانات وتصور البيانات.
  • المصطلح شامل تمامًا، حيث يشمل البيانات ونطاقات البيانات، بالإضافة إلى الأدوات والتقنيات المستخدمة لمعالجة البيانات وتحليلها.

انواع البيانات الضخمة

  • البيانات المنتظمة

نقصد بالبيانات المنتظمة البيانات التي يمكن معالجتها وتخزينها واستردادها بتنسيق ثابت. وهو يشير إلى معلومات منظمة للغاية يمكن تخزينها بسهولة والوصول إليها من قاعدة بيانات بواسطة خوارزميات بسيطة لمحركات البحث. على سبيل المثال، سيتم تنظيم جدول الموظفين في قاعدة بيانات الشركة حيث ستكون تفاصيل الموظفين، ومواقع عملهم، ورواتبهم، وما إلى ذلك، موجودة بطريقة منظمة.

  • البيانات الغير منتظمة

تشير البيانات غير المنتظمة إلى البيانات التي تفتقر إلى أي شكل أو هيكل معين على الإطلاق. وهذا يجعل الأمر صعبًا للغاية ويستغرق وقتًا طويلاً في معالجة البيانات غير المنظمة وتحليلها. البريد الإلكتروني هو مثال على البيانات الضخمة غير المنتظمة.

  • البيانات شبه المنتظمة

وتتعلق البيانات شبه المنظمة بالبيانات التي تحتوي على كل من التنسيقات المذكورة أعلاه، أي البيانات المنظمة وغير المنظمة. على وجه الدقة، فإنها تشير إلى البيانات التي على الرغم من أنه لم يتم تصنيفها في مكان معين (قاعدة بيانات)، إلا أنه يحتوي على معلومات أو علامات حيوية تفصل العناصر الفردية داخل البيانات.

خصائص البيانات الضخمة

  • متنوعة 

مجموعة متنوعة من البيانات الكبيرة تشير إلى بيانات منتظمة وغير منتظمة وشبه منتظمة والتي يتم جمعها من مصادر متعددة. بينما في الماضي، كان يمكن جمع البيانات فقط من جداول البيانات وقواعد البيانات، واليوم تأتي البيانات في مجموعة من النماذج مثل رسائل البريد الإلكتروني، وملفات الـ PDF، والصور، والفيديوهات، والتسجيلات الصوتية، ونشرات الـ SM، وأكثر من ذلك بكثير.

  • سريعة

تشير السرعة أساسًا إلى السرعة التي يتم بها إنشاء البيانات الضخمة في الوقت الفعلي. وفي نطاق أوسع، تشتمل على معدل التغيير، وربط مجموعات البيانات الواردة بسرعات مختلفة. وسرعة استخراجها في بعض الاحيان.

  • ضخمة

تشير إلى “كميات كبيرة” من البيانات التي يتم إنشاؤها على أساس يومي من مصادر متنوعة مثل منصات وسائل التواصل الاجتماعي، وعمليات الأعمال، والآلات، والشبكات المختلفة، والتفاعلات البشرية، وما إلى ذلك. حيث يتم تخزين هذه الكمية الكبيرة من البيانات في مستودعات البيانات الضخمة.

error: Content is protected !!