Home > Posts > BigData > تحليل البيانات الضخمة Big Data

تحليل البيانات الضخمة Big Data

يتردد مصطلح البيانات الضخمة في عالم التكنولوجيا والمعلومات مؤخرًا، لكن علينا أن نتفق في البداية أن هذا المفهوم وفقًا لما أوضحه الاتحاد الدولي للاتصالات، بأنه الصورة الخام للمعلومات.

كما أشار الاتحاد الدولي للاتصالات بأنه لا يوجد تعريف دقيق حتى الآن لمفهوم البيانات الضخمة، وأن البعض يشير له دائمًا بإنه الصورة الخام للمعلومات قبل القيام بعملية الفرز والترتيب والمعالجة، حيث لا يمكن الاستفادة من هذه المعلومات في صورتها الخام أو بشكلها الأولي قبل عملية المعالجة.

مفهوم البيانات الضخمة

يشير الخبراء في هذا المجال، أن البيانات الضخمة هي مجموعة من البيانات التي تعتبر بحجم يفوق قدرة معالجتها باستخدام أدوات قواعد البيانات العادية، عن طريق الالتقاط والمشاركة والتخزين بجانب الإدارة والتحليل في فترة زمنية محددة لهذه البيانات.

على الجانب الآخر، ينظر مقدمي الخدمات إلى البيانات الضخمة على أنها الأدوات والعمليات التي تحتاجها المنظمات للتعامل مع كمية كبيرة من البيانات بقصد تحليلها، إلا أن الخبراء ومقدمي الخدمات اتفقوا على أنها بيانات هائلة لا يمكن معالجتها بالطرق العادية.

أنواع البيانات الضخمة

ويمكن تقسيم البيانات الضخمة إلى عدة أنواع، منها:

البيانات المهيكلة، وهي البيانات التي يتم تنظيمها داخل جداول أو قواعد للبيانات.

البيانات غير المهيكلة، وهي الكم الأكبر من البيانات التي يولدها الأشخاص بشكل يومي من خلال الكتابات النصية والصور والفيديوها، او من خلال النقرات اللحظية أو مراسلات الإنترنت ومواقع التواصل.

البيانات شبة المهيكلة، وهي نوع من البيانات المهيكلة لكنها لا تكون في صورة جداول أو قواعد بيانات على الإطلاق.

ما هي خصائص البيانات الضخمة

يمكن التصديق على أن هذا النوع من البيانات يوفر ثلاث عوامل رئيسية، وهي:

أولًا: الحجم: وهو يعني عدد التيرابايت من البيانات التي نقوم بإطلاقها بشكل يومي من المحتوى.

ثانيًا: التنوع: وتعني تنوع هذه البيانات ما بين البيانات المهيكلة وغير المهيكلة وشبة المهيكلة.

ثالثًا: السرعة: وتهتم بمدى سرعة حدوث تلك البيانات، كما تختلف السرعة من نشر التغريدات عن سرعة مسح أجهزة الاستشعار مثلًا.

ويمكن تميز البيانات الضخمة من خلال حجمها وتنوعها وسرعتها عن طريق دراسة الحجم الكبير للبيانات التي قد تُمكن الشركات من فهم عملائها بصورة أكبر، فعلى سبيل المثال: شركة تبحث في بيانات مشتريات أكثر من مليون عميل لديها، فعن طريق هذا النوع من البيانات ستحصل على معلومات مفيدة للغاية من جانب الإدارة ومتخذي القرار.

لماذا نستخدم البيانات الضخمة

السبب الأبرز في استخدام هذا النوع من البيانات أو الاعتماد عليه، هو بسبب أنها تستمر بإنتاج أكبر كم من البيانات والمعلومات من خلال اعتمادها على بعض الأجهزة والمصادر، كما أن تلك البيانات تكون غير مهيكلة مثل: التغريدات في مواقع التواصل، والفيديوهات على اليوتيوب، ونشر الحالات على فيسبوك. تلك البيانات التي يصعب إدارتها باستخدام الأدوات العادية.

error: Content is protected !!