ما هي البيانات الضخمة «Big data»؟
هكذا كانت كلمات الإعلامي المصري عمرو أديب في إحدى حلقات برنامجه يوم السبت السابق تعليقا على مفهوم البيانات الضخمة – Big Data. استرسل عمرو في ضرب عدد من الأمثلة يشرح من خلالها فكرته عن مفهوم البيانات الضخمة، الأمر الذي أثار ضده ردود أفعال ساخرة على مواقع التواصل الاجتماعي المختلفة منها موقعا فيسبوك ويوتيوب، فلماذا أثيرت كل هذه الضجة على ما قاله الإعلامي المصري؟
دعونا نترك قليلًا ما تحدث به عمرو أديب وردود الفعل المثارة ضده، ونأخذ جولة صغيرة في عالم البيانات الضخمة لنرى ما هي.
البيانات الضخمة
البيانات الضخمة هي مجموعة هائلة وضخمة جدًا من البيانات في أشكالها المختلفة من كلمات وصور ورسائل صوتية وغيرها، لك أن تتخيل أن حجم البيانات في العالم الرقمي وصل إلى 4.4 زيتابايت ( 4.4 تريليون جيجابايت) في عام 2013، ومتوقع أن يصل حجم هذه البيانات إلى 44 زيتابايت في عام 2020، وسيصل حجمها إلى ما يقرب من 180 زيتابايت بحلول عام 2025 طبقا لدراسة أجرتها مؤسسة البيانات الدولية – International Data Corporation الصادر بعام 2014.
لكي ينطبق على مجموعة من البيانات مفهوم البيانات الضخمة يجب أن يتوافر بها أحد الشروط التالية:
الحجم
لابد أن يكون حجم هذه البيانات ضخمًا بشكل واضح، فلا يمكن أن نعتبر حجم البيانات الموجودة على أجهزتنا بيانات ضخمة فهي لا تتعدى في أحسن الأحوال 1 تيرابايت، لكن لك أن تتخيل أن حجم الصور المخزنة فقط على موقع الفيسبوك بعام 2015 يزيد على 250 مليار صورة والتي تزيد يوميًا بمعدل 350 مليون صورة،هنا يمكننا اعتبار حجم الصور التي يخزنها الفيسبوك يوميًا بالبيانات الضخمة.
يمكننا كذلك اعتبار عدد التغريدات على موقع تويتر في اليوم الواحد بالبيانات الضخمة حيث تصل إلى ما يزيد على 150 مليون تغريدة. لكن وجب التنويه بأنه لا يجب دائمًا أن تكون البيانات الضخمة في كل مرة بهذه الضخامة بالطبع، يمكنها أن تكون أصغر بعض الشيء من هذا الكم الهائل؛ لكن هذا مجرد مثال يوضح لنا أن حجم هذه البيانات ليس بالصغير.
السرعة
يعتبر المعيار الثاني لتصنيف البيانات على أنها بيانات ضخمة هي سرعة تدفق هذه البيانات، فكما ذكرنا تويتر يستقبل 150 مليون تغريدة يوميًا أي يستقبل 2.5 مليون تغريدة في الساعة وما يزيد على 41 ألف تغريدة في الثانية. لذا يتم اعتبارها بيانات ضخمة لسرعة تدفق هذه البيانات.
التنوع
هناك أشكال مختلفة من البيانات، إما في شكل نصوص مكتوبة، أو رسائل صوتية، أو فيديوهات وغيرها من الأشكال التي يمكن أن تتواجد عليها هذه البيانات. تنوع هذه البيانات من الممكن أن يجعلها تدخل تحت تصنيف البيانات الضخمة؛ لأنها تستغرق وقتًا في العمل عليها على عكس إن كانت على شكل واحد.
كذلك تنقسم هذه البيانات إلى الآتي:
بيانات منظمة
تكون هذه البيانات على درجة عالية من النظام والتي تكون عادة في صورة كتابية مثل البيانات الموجودة بقواعد البيانات المترابطة أو البيانات المتواجدة في الجداول ببرنامج الإكسيل.
على سبيل المثال، هناك قاعدة بيانات لشركة ما تحمل بداخلها مليون قطعة من المعلومات لمائة ألف من عملائها، فتحتوي بداخلها على اسم كل شخص ورقم هاتفه ومحل إقامته ووظيفته وبيانات أخرى، توجد هذه البيانات في صوة منظمة ومرتبة تستطيع أن تبحث بها بسهولة.
بيانات غير منظمة
تتسم هذه البيانات بالعشوائية وعدم الترتيب. من أمثلة هذه البيانات، البيانات الموجودة على مواقع التواصل الاجتماعي سواء كانت مكتوبة مثل فيسبوك وتويتر ولينكدإن، أو مُشاهدة مثل الموجودة على موقع يوتيوب والصور المختلفة التي يتم رفعها على شبكة الإنترنت بصورة عشوائية.
بين البيانات المنظمة والبيانات غير المنظمة، يوجد بيانات شبه منظمة أيضًا والتي تحمل بعضًا من الترتيب ولا يتم تصنيفها بالعشوائية الكاملة، كما أن هناك شروطًا أخرى يمكن من خلال تعريف البيانات على أنها بيانات ضخمة بجانب الحجم والسرعة والتنوع.
مجالات استخدام البيانات الضخمة
في البداية، لا تكمن أهمية هذه البيانات في حجمها بقدر ما تكمن فيما يمكن أن نفعله بها، فتهتم المؤسسات الحكومية والخاصة في الأيام الحالية بتحليل واستخلاص بعض المعلومات والتحليلات، وكذلك إجابات لكثير من الأسئلة المطروحة عندهم من خلال هذه البيانات، مما يساعدهم في تطوير خدماتهم أو منتجاتهم وما يتعلق بهم، هنا نذكر بعض المجالات التي يمكن أصحابها الاستفادة من بياناتهم الضخمة.
الخدمات المصرفية
تتجه البنوك لإنشاء قاعدة رقمية تسجل فيها كل البيانات الخاصة بعمليات الإيداع أو السحب، المعاملات المالية المختلفة، سجلات الاتصالات المختلفة بخدمة العملاء لتقوم بتحليل كل تلك البيانات ومن ثم تعزيز الأمن السيبراني لديها، كذلك توفير مجموعة من العروض المبتكرة والشخصية لكل عميل على حدة لتجعل من تجربة العميل المصرفية تجربة فردية وفريدة من نوعها.
الصناعة
تساعد البيانات الضخمة الشركات في تعزيز جودة وكفاءة إنتاج منتجاتهم المختلفة مع التقليل من النفايات بشكل عملي أكثر، كما تساعد هذه الشركات في اتخاذ قرارات تجارية أكثر مرونة وتوفير حل للمشكلات سريعًا استنادًا إلى تحليلات تم استنباطها ومعرفتها من البيانات المختلفة، كذلك تساهم هذه البيانات في اتخاذ قرارات مستقبلية تساعد الشركة في تحقيق نجاحات أكبر على مستوى التوسع والربح.
الصحة
يعتبر مجال الصحة أحد أهم المجالات التي تسهم البيانات الضخمة في تحسينها بقوة، حيث تستخدم البيانات في تحسين الخدمات والتعرف بشكل أفضل على الوضع العام للصحة بالدولة وعيوبه لمحاولة حلها بصورة سريعة.
يوجد في الولايات المتحدة الأمريكية أحد الأنظمة التي يعمل على تخزين وجمع البيانات وتبادلها بين أكثر من 39 مستشفى في إحدى المناطق، ساعدتهم هذه البيانات في إعادة تحديد وتطبيق أفضل الممارسات الطبية للحد من عودة المريض مرة أخرى، كذلك توقع خطر الفشل الكلوي والتدخل المبكر للحد من النتائج السلبية، بالإضافة إلى تحسين إدارة عمل المستشفيات والصيدليات لتعمل بصورة أكثر كفاءة لتناسب المرضى وحالاتهم.
مواقع التواصل الاجتماعي
تجد الشركات والمؤسسات الكبرى ضالتها في مواقع التواصل الاجتماعي، تساعدها هذه المواقع في جمع أكبر حجم من البيانات الممكنة من عملائها مباشرة وردود أفعالهم وانطباعاتهم تجاه منتجاتهم أو خدماتهم سواء كانت بالإيجاب أو بالسلب.
تستطيع الشركات من خلال هذه البيانات توقع ما سيطلبه العملاء قبل أن يطلبوا ذلك، حيث يكشف مستخدمو هذه المواقع عن أذواقهم الخاصة، ما يفضلون وما لا يفضلون، ردود أفعالهم تجاه أمور عدة، الصفحات التي يتابعونها والمشاركات التي يشاركونها مع أصدقائهم على هذه المواقع.
تسمح كذلك البيانات الضخمة للشركات أن تكتشف المشكلات التي يشتكي منها أغلب عملائها ويبادرون سريعًا بحلها، تقوم الشركات بجمع وتحليل جميع التعليقات والمنشورات والتغريدات التي يقوم عملاؤها ومتابعوها بكتابتها ليتمكنوا من تحديد ورصد المشكلات.
شركة Delta Air Lines على سبيل المثال وجدت من خلال تحليل هذه البيانات أن أغلب علمائها يشتكون من فقد الأمتعة أثناء سفرهم، فقامت بإضافة خاصية جديدة لتطبيقها تمكن العملاء من تتبع ومراقبة حقائبهم، هذا لم يمكنهم فقط من حل المشكلة؛ لكن أضاف لهم ميزة تنافسية أخرى ضد منافسيهم في مجال الطيران.
هناك العديد من المجالات الأخرى التي تساعد البيانات الضخمة في تطويرها وتمكينها من توفير خدمات أفضل في المستقبل وتحسين عملياتها اليومية مثل مجال التعليم والنقل، كما تساعد أيضًا الحكومات بشكل كبير في تعزيز قدرتهم على خدمة المواطنين ومواجهة التحديات في الاقتصاد، ومواجهة الكوارث الطبيعية والإرهاب وكذلك خلق فرص عمل بشكل أفضل، للإطلاع بصورة أكبر على تطبيقات البيانات الضخمة في القطاعات الحكومية يمكنك تحميل وقراءة هذه الدراسة من هنا
هذه مجرد نبذة مختصرة عن مفهوم البيانات الضخمة واستخداماتها بشكل عام، إن كنت ترغب في المعرفة أكثر وبدء خوض رحلتك التعليمية بداخل عالم البيانات الضخمة فيمكنك أن تبدأ ببرنامج شركة مايكروسوفت العالمية على موقع التعلم إيدكس من هنا.