Home > Posts > BigData > ما هي انواع البيانات الضخمة Big Data

ما هي انواع البيانات الضخمة Big Data

في الفترة الأخيرة لعب مصطلح البيانات الضخمة تحت الأضواء، لكن لا يعرف الكثير من الناس البيانات الضخمة.

تعمل الشركات والمؤسسات الحكومية و HCPs (مقدمي الرعاية الصحية) والمؤسسات المالية بالإضافة إلى المؤسسات الأكاديمية على الاستفادة من قوة البيانات الكبيرة لتعزيز آفاق الأعمال إلى جانب تحسين تجربة العملاء.

تؤكد شركة IBM أن الشركات حول العالم تولد ما يقرب من 2.5 مليار بايت من البيانات يوميًا! تم إنتاج 90٪ تقريبًا من البيانات العالمية في العامين الماضيين فقط.

ما هي البيانات الضخمة

البيانات الضخمة هي حجم كبير، وسرعة، وأصول معلومات متنوعة تتطلب أشكالًا مبتكرة فعالة من حيث التكلفة لمعالجة المعلومات لتحسين الرؤية واتخاذ القرارات.

يجيب هذا التعريف بوضوح عن السؤال “ما هي البيانات الكبيرة؟” – تشير البيانات الضخمة إلى مجموعات البيانات الكبيرة والمعقدة التي يجب معالجتها وتحليلها لكشف معلومات قيمة يمكن أن تفيد الشركات والمؤسسات.

ومع ذلك، هناك بعض المبادئ الأساسية للبيانات الكبيرة التي ستجعل من الأسهل الإجابة على البيانات الكبيرة:

يشير إلى كمية هائلة من البيانات التي تستمر في النمو مع مرور الوقت بشكل كبير.

إنه ضخم للغاية بحيث لا يمكن معالجته أو تحليله باستخدام تقنيات معالجة البيانات التقليدية.

وهي تشمل استخراج البيانات وتخزين البيانات وتحليل البيانات ومشاركة البيانات وتصور البيانات.

المصطلح شامل تمامًا ويشمل البيانات وأطر البيانات، بالإضافة إلى الأدوات والتقنيات المستخدمة لمعالجة البيانات وتحليلها.

أنواع البيانات الضخمة

الآن وبعد أن انتهينا من البيانات الضخمة، دعنا نلقي نظرة على نماذج البيانات الضخمة:

النوع الأول: المنظم

نقصد بالبيانات المهيكلة البيانات التي يمكن معالجتها وتخزينها واستردادها بتنسيق ثابت. وهو يشير إلى معلومات منظمة للغاية يمكن تخزينها بسهولة وبسهولة والوصول إليها من قاعدة بيانات بواسطة خوارزميات بسيطة لمحركات البحث.

على سبيل المثال، سيتم تنظيم جدول الموظف في قاعدة بيانات الشركة حيث ستكون تفاصيل الموظف، ومواقع العمل، ورواتبهم، وما إلى ذلك، موجودة بطريقة منظمة.

النوع الثاني: الغير منظم

تشير البيانات غير المهيكلة إلى البيانات التي تفتقر إلى أي شكل أو هيكل معين على الإطلاق.

وهذا يجعل الأمر صعبًا للغاية ويستغرق وقتًا طويلاً في معالجة البيانات غير المنظمة وتحليلها. البريد الإلكتروني هو مثال على البيانات غير المهيكلة.

النوع الثالث: الشبه منظم

وتتعلق البيانات شبه المنظمة بالبيانات التي تحتوي على كل من التنسيقات المذكورة أعلاه، أي البيانات المنظمة وغير المنظمة.

على وجه الدقة، فإنه يشير إلى البيانات التي على الرغم من أنه لم يتم تصنيفها في مستودع معين (قاعدة بيانات)، إلا أنه يحتوي على معلومات أو علامات حيوية تفصل العناصر الفردية داخل البيانات.

النوع الرابع: التشكيل

مجموعة متنوعة من البيانات الكبيرة تشير إلى بيانات منظمة وغير منظمة وsemistructured التي يتم جمعها من مصادر متعددة. بينما في الماضي، يمكن جمع البيانات فقط من جداول البيانات وقواعد البيانات، واليوم تأتي البيانات في مجموعة من النماذج مثل رسائل البريد الإلكتروني، ملفات PDF، الصور، الفيديوهات، التسجيلات الصوتية، وأكثر من ذلك بكثير.

النوع الخامس: السرعة

تشير السرعة أساسًا إلى السرعة التي يتم بها إنشاء البيانات في الوقت الفعلي.

وفي نطاق أوسع، تشتمل على معدل التغيير، وربط مجموعات البيانات الواردة بسرعات مختلفة.

النوع السادس: الصوت

نحن نعلم بالفعل أن  Big Data أو البيانات الضخمة تشير إلى “كميات كبيرة” من البيانات التي يتم إنشاؤها على أساس يومي من مصادر متنوعة مثل منصات وسائل الإعلام الاجتماعية، وعمليات الأعمال، والآلات، والشبكات، والتفاعلات البشرية، وما إلى ذلك.

يتم تخزين هذه الكمية الكبيرة من البيانات في مستودعات البيانات.

error: Content is protected !!