Home > Posts > BigData > نبذة مختصرة عن أنواع وتصنيف البيانات الضخمة ” Big Data “

نبذة مختصرة عن أنواع وتصنيف البيانات الضخمة ” Big Data “

أنواع وتصنيف البيانات الضخمة ” Big Data “

البيانات الضخمة ولكن قبل التطرق لتعريفها ، يجب التعرف على ماهية البيانات اولاً !


البيانات ” Data “: هي المادة الخام لمجموعة من المعلومات قبل إجراء عملية الفرز أو الترتيب والمعالجة عليها، حيث أنة لا يمكن الاستفادة منها في صورتها الأولي قبل هذه العمليات

تنقسم هذه البيانات لثلاثة انواع :

١- بيانات هيكلية : وهي بيانات تم تنظيمها في جدول أو قاعدة بيانات
٢- البيانات غير هيكلية : وهي النسبة الأكبر من البيانات، بمعنى أدق هي البيانات التي ينتجها الناس يوميا من نصوص وصور وفيديو و نقرات على المواقع الإلكترونية
٣- بيانات شبه هيكلية : تعد نوع من البيانات المهيكلة ولكنها ليست في جداول أو قواعد بيانات.


ماذا تعني البيانات الكبيرة او الضخمه ” BigData ” ؟
بحسب تعريف معهد ماكنزي العالمى عام 2011،
فأن البيانات الكبيرة – Big Data هي أى مجموعة من البيانات التي لا تسطيع اي اداوت لقواعد البيانات التعامل معها،
سواء تخزين او إلتقات او إداره او خاصه تحليل.

توضيح التعريف:

اذا كان هناك شرح اوضح لهذا التعريف، فإن البيانات الضخمة او Big Data مقسمه لجزئين:
هناك 10% فقط من البيانات تم تنظيمها وتحليلها وتخزينها في قواعد البيانات حول العالم.
بينما يوجد مايقرب من 90% من البيانات عباره عن معلومات وصور وفيديوهات ورسائل إيميل وتغريدات ومنشورات علي الفيسبوك،
كل هذه المعلومات غير محدده او تم حصرها وتحليلها.


تصنيف البيانات الضخمة :

البيانات الضخمة لا يتم تصنيفها وفقا للحجم فقط كما يعتقد الكثير، فهي تصنف وفقا لما يسمي 3V’s والذي يتكون من :


– حجم Volume
وهو حجم البيانات المستخرج من مصدر ما وهو أكبر الصفات أهمية في عملية التحليل
كما أن وصفها ب ” ضخمة ” لا يحدد كمية بعينها
فمن المتوقع أنه في 2020 سيكون هناك ما يقرب من 40.000 ميتابايت من البيانات الجاهزة لعملية التحليل واستنتاج المعلومات

– التنوع Variety
والقصد هنا هو تنوع البيانات التي تم استخراجها، والتي تساعد الباحثين والمحللين على اختيار البيانات المناسبة لطبيعة البحث
وتحتوي على بيانات هيكلية وقواعد بيانات وبيانات غير هيكلية أي غير ممنهجة من صور وفيديوهات ونصوص وسجلات مكالمات وخرائط
ولكنها تطلب وقت ومجهود كبير للعمل عليها

السرعة Velocity :
وهي السرعة في إنتاج البيانات لتغطية الطلب عليها
حيث أن السرعة من أهم العناصر أتخاذ القرارت نسبة لهذه البيانات وهو الوقت ما بين وصول البيانات ولحظة الخروج بالقرار بناء علية
وبسبب هذه النقطة تم ايجاد حلول وتقنيات مثل hadoop و SAP HANA و Apache

 

ما هى الـ Big Data وكيف تتمكن من جعل الناس أكثر صحة؟

البيانات الكبيرة او الـ Big Data يرسم مسقبل البشر بمهارة موظفيه

Add Comment

Click here to post a comment

error: Content is protected !!