النَّفط المعرَّفي الجديد .. حول مفهوم “البيانات الضَّخمة” وتحدِّياته المستقبليّة

أفق – إسلام حجازي

مع تزايد ثورات التحوّل الرقميّة التي يعيش العالَم مع جديدٍ لها كلّ يوم تقريباً، أصبح عِلم البياناتواحداً من أكثر التخصّصات العلميّة المُنتشرة بكثافة في معظم جامعات الدول المتقدّمة من دون استثناء، وذلك بسبب ارتفاع حَجم الطَّلب الوظيفيّ العالَميّ، من جانب كبرى الشركات الاقتصاديّة الخاصّة والمؤسّسات الحكوميّة على حدٍّ سواء، على العُلماء والباحثين القادرين على التعامل بدقّة مع الكمّ الهائل والمُتزايد من البيانات الضخمة “Big Data” وتحليلها، بهدف استخلاص المعلومات وتطوير الرؤى والتصوّرات التي تخدم أهدافها ومَصالحها المستقبليّة في مجالات متنوّعة، مثل التجارة الإلكترونيّة، والاستثمارات الاقتصاديّة، والتغيّرات البيئيّة والمناخيّة، والسياسات العامّة، والاستخبارات العسكريّة والأمنيّة، والتسويق الإلكترونيّ، وغيرها.

إنّ كلّ مُواطِن على سطح هذا الكوكب تقريباً، أصبح له قَرينٌ افتراضيّ يُلازِم شخصيّته الواقعيّة، ويترك بصماتٍ رقميّة مميّزة لأبسط أنشطة حياته اليوميّة وممارساتها التي يتفاعل من خلالها مع الآلات الذكيّة على شبكة الإنترنت؛ فالكلمات التي نبحث عنها عن طريق محرّكات البحث الشهيرة مثل غوغل، والصُّور الشخصيّة التي ننشرها مع أصدقائنا على مَوقع إنستغرام، والمُنتجات التي نشتريها من مواقع التسوّق الإلكتروني المُختلفة، والصفحات والتعليقات التي نسجِّل إعجابنا بها على مَوقع الفيسبوك، والأماكن التي نذهب إليها بصحبة تطبيقات الخرائط الملاحيّة في هواتفنا الذكيّة، والتغريدات القصيرة التي نعبِّر بها عن آرائنا ومشاعرنا على مَوقع تويتر، والوظائف التي نبحث عنها على مَوقع لينكد إن، كلّها أنشطة ومُمارسات عاديّة، تترك بصماتنا الرقميّة التي يسعى علماء البيانات الضخمة إلى اقتفاء آثارها، تمهيداً لفرْزها وترتيبها ومُعالجتها.

وبحسب بعض التقديرات، يبدو أنّ حصيلة تفاعلاتنا اليوميّة مع المنتجات والخدمات الرقميّة، بما في ذلك الهواتف الخلويّة وبطاقات الائتمان ومنصّات التواصل الاجتماعي، سوف تُسهم في إنتاج الجزء الأكبر من بيانات العالَم خلال السنوات القليلة القادمة. فبحلول العام 2020، يتوقّع البعض أن يكون هناك 1.7 ميغابايت من البيانات الجديدة في كلّ ثانية لكلّ فرد على سطح هذا الكوكب، وهو ما يعني حدوث زيادة فائقة في حَجم بيانات الفضاء الافتراضي المُتراكِمة من 4.4 زيتابايت اليوم إلى حوالى 44 زيتابايت، أو 44 ترليون جيغابايت.

وقبل الحديث عن مفهوم البيانات الضخمة والتعرّف إلى مؤشّرات جودتها، يجب علينا التفريق أوّلاً بين البيانات والمعلومات، حيث تشير البيانات عادةً إلى الصورة الخامّ للمعلومات قبل عمليّات الفرز والترتيب والمُعالَجة، وتتنوّع هذه البيانات من حيث درجة تنظيمها إلى بيانات مُهيكَلة، وبيانات غير مُهيكَلة، وبيانات شبه مُهيكَلة، وفي جميع الأحوال لا يُمكن الاستفادة منها بصورتها الأوليّة الخامّ؛ فلكَي تتحوّل إلى معلومات يُمكن الاستفادة منها، واتّخاذ قرارات وسياسات بناءً عليها، لا بدّ من مُعالجتها وتحليلها وتفسيرها.

ثورة صناعيّة في البيانات

كان جوزيف هيلرستاين، أستاذ علوم الحَوْسَبة في جامعة بيركلي في كاليفورنيا، من أوائل الذين أشاروا إلى دنوّ حدوث “ثورة صناعيّة في البيانات” بحسب تعبيره، في حين ذَكَر معهد ماكينزي في تقريرٍ له في العام 2011، مصطلح “البيانات الضخمة”، باعتباره يشير إلى مجموعة من البيانات التي هي بحجمٍ يفوق قدرة أدوات قواعد البيانات التقليديّة على التقاط تلك البيانات. وتخزينها وإدارتها وتحليلها. وفي العام 2012، أصبح مفهوم البيانات الضخمة أكثر شيوعاً عندما جعل البيت الأبيض ومنتدى دافوس الاقتصادي العالَمي هذا المفهوم قضيّة مستقبليّة مركزيّة تحتاج إلى مزيدٍ من المُتابعة والاهتمام. وبشكلٍ أكثر دقّة من ناحية التعريف بخصائص البيانات الضخمة، ذهب الاتّحاد الدولي للاتّصالات (ITU) إلى تعريف هذا المصطلح بأنّه عبارة عن “مجموعات البيانات التي تتميّز بأنّها فائقة حجماً وسرعة و/أو تنوّعاً، بالقياس إلى أنواع مجموعات البيانات المعهودة الاستخدام”. وعليه، أصبح من الصعب، أو بمعنى أدقّ من المستحيل، التعامل مع البيانات الضّخمة باستخدام قواعد البيانات التقليديّة المعروفة بالعلائقيّة (Relational Data Bases)، حيث لا يُمكن مُعالجتها إلّا من خلال أنظمة وتقنيّات وبرمجيّات متقدّمة تعمل بشكلٍ متوازٍ على العشرات أو المئات، أو حتّى آلاف من الخوادم. ويؤكّد أغلب الخبراء أنّ مفهوم البيانات الضخمة بهذا الشكل يقوم على ثلاثة مؤشّرات وخصائص جوهريّة، هي: الحجم (volume)، والسرعة (velocity)، والتنوّع (variety)، أو ما يشار إليه في اللّغة الإنكليزيّة بمبدأ الـ(3Vs)، علماً بأنّ بعض الخبراء والمؤسّسات الأخرى تضيف خاصيّتَيْ الصدقيّة (Veracity)، والقيمة (Value) إلى قائمة الخصائص الثلاث الأخرى التي يستند إليها تعريف البيانات الضخمة.

وبحسب التقديرات الواردة في دليل الإنفاق العالَمي نصف السنوي على البيانات الضخمة والتحليلات، من المتوقَّع نموّ العائدات العالميّة للبيانات الضخمة وتحليلات الأعمال من قرابة122 مليار دولار أميركي في العام 2015 إلى ما يزيد على187 مليار دولار أميركي في العام 2019، وهي زيادة تتعدّى 50% في غضون خمس سنوات فقط. ويؤكّد الخبراء أنّ المنطقتَين اللتَين ستحظيان بأعلى نسبة من النموّ خلال هذه الفترة هُما منطقة أميركا اللاتينيّة، ومنطقة الشرق الأوسط وأفريقيا. ومن المرجّح أيضاً أن تكون المجالات التي ستنضوي على فُرص تحقيق أكبر الإيرادات العالميّة للبيانات الضخمة وتحليلات الأعمال هي التصنيع التجميعي، والخدمات المصرفيّة، والعمليّات الصناعيّة التحويليّة. وفي الوقت ذاته، ستُحقِّق أربعة قطاعات أخرى، هي القطاع الحكومي/الفيدرالي، وقطاع الخدمات المهنيّة، وقطاع الاتّصالات، وقطاع التجزئة، أرباحاً تزيد على 10 مليارات دولار أميركي في العام 2019، والقطاعات التي ستشهد النموّ الأسرع لهذه الإيرادات أيضاً ستشمل المَرافقَ، وصناعات المَوارد، والرعاية الصحيّة والخدمات المصرفيّة، وذلك على الرّغم من أنّ جميع القطاعات الاقتصاديّة تقريباً ستشهد مَكاسب تزيد على 50% خلال الفترة ما بين العامَيْن 2015 و 2019.

تحدّيات تطبيقات البيانات الضخمة

على الرّغم من هذه الأرقام والتنبّؤات المُذهلة كلّها بشأن مستقبل هذا النفط المَعرفي الجديد، إلّا أنّ أغلب دراسات البيانات الضخمة وممارساتها تكاد لا تخلو من الإشارة إلى بعض التحدّيات المرتبطة بها، وهي التحدّيات الثلاثة التي برع في تلخيصها نيل ريتشاردز وجوناثان كينغ، أستاذا القانون في جامعة واشنطن، في دراستهما المنشورة في مجلّة “Stanford Law Review”، حينما أكّدا أنّ أوّلها يأتي من مفارقة الشفافيّة. ففي الوقت نفسه الذي يَعدنا فيه مُستخدِمو البيانات الضخمة بجعل العالَم أكثر شفافيّة، نجدهم يعملون بأدوات وتقنيّات غير شفّافة على الإطلاق، مُحاطة بانتهاكات متزايدة لخصوصيّة الأفراد وأمنهم. لذلك، لا بدّ من الاعتراف بمفهوم الشفافيّة في توليد البيانات الضخمة وإدارتها وتحليلها بجميع جوانبها من دون استثناء، وتطوير الضمانات التقنيّة والقانونيّة والأخلاقيّة كافّة القادرة على تحقيق التوازن الحقيقي بين حماية خصوصيّة الأفراد واحترام سيادة البيانات.

أحد التحدّيات الأخرى التي تُرافق تطبيقات البيانات الضخمة تأتي من مُفارقة الهويّة؛ فإذا كانت معظم البيانات الضخمة تُجمَع من المخلّفات الرقميّة التي يتركها الأفراد وراءهم في الفضاءات الافتراضيّة، فإنّ الجمع بين مجموعات بيانيّة وخوارزميّات عدّة يُمكن أن يؤدّي إلى تحديد هويّة هؤلاء الأفراد، ما قد يعرّضهم لأخطار مُحتمَلة؛ بل والأخطر من ذلك أنّ الشركات والحكومات التي ستعرف كيفيّة توليد المعلومات الاستخباراتيّة من البيانات الضخمة، سوف تكون أكثر قدرة على صياغة التقنيّات التي تدفعنا نحو ما يريدون، بشكلٍ قد يُفقدنا هويّاتنا كما حدّدناها واعتززنا بها في الماضي. فضلاً عن ذلك، فإنّ تقويض خياراتنا الفكريّة، والتأثير على طُرق تشكيل هويّاتنا الفرديّة والجماعيّة، سوف يؤدّي بالضرورة إلى تآكل قوّة ديمقراطيّتنا ونوعيّتها.

أمّا التحدّي الثالث والأخير للبيانات الضخمة، فيرتبط بتفاوت القوّة النّاتِج عن الفجوة بين مَن يملكون البيانات ومَن لا يملكونها. صحيح أنّ البعض ينظر إلى أغلبيّة التحوّلات التقنيّة الجديدة كأدة قوّة، قد تساعد بشكلٍ أو بآخر في حدوث التمكين السياسي والاقتصادي والاجتماعي للمُستخدِم العادي، لكن لا يخفى على أحد أيضاً أنّ أجهزة استشعار البيانات الضخمة، تتواجد في الأغلب بأيدي مؤسّسات وسطيّة من الأجهزة الحكوميّة والشركات الكبرى، وليس لدى الناس العاديّين. ومن المتوقَّع أيضاً أن تقوم البيانات الضخمة بفتْح جبهة جديدة وخطيرة من تفاوُت القوى بين دول العالَم، تقسّمهم بين مَن يعرفون ومَن لا يعرفون. فالحروب القادِمة ستكون حروب معلوماتيّة بالأساس، وبالتالي فإنّ الذي ستكون لديه القدرة على الوصول إلى البيانات الضخمة وتحليلها، سيكون قادراً على تأمين فُرصٍ جديدة لتعزيز ذكائه الاستخباراتي، واتّخاذ القرارات الصحيحة والمُناسِبة لأمنه القَومي.

يكرّرون على الدوام أنّ “التكنولوجيا سلاحٌ ذو حدَّين”. والحقيقة أنّ تحوّلات ثورة البيانات الضخمة لم ولن تشكّل استثناء عن هذه القاعدة. فمَع تزايُد تأثيرها الواضح في تغيير هياكل السلطة وعمليّات صنْع القرار، وليس لمجرّد تكوين وجهات نظر، أصبحت حكوماتنا العربيّة مُطالَبة بضرورة العمل السريع والجادّ من أجل بلْورة استراتيجيّات وسياسات رقميّة مستقبليّة، تضع الاستثمارات في هذا النفظ المَعرفي الجديد على رأس أولويّاتها، وتَضمن تحقيق التوازن بين الخصوصيّة واحترام سيادة البيانات، وهو الأمر الذي لا يُمكن أن يحدث من دون السعي الدؤوب لدعم منظومة بحث عِلميّ متكاملة وتطويرها في مجالات البيانات الضخمة المتعدّدة من جهة، وصوغ مجموعة أُطر قانونيّة وأخلاقيّة وتقنيّة لجمْع البيانات الضخمة، وتخزينها، وتبادلها من جهة أخرى.

*مدرِّس مُساعد في كليّة الاقتصاد والعلوم السياسيّة، جامعة القاهرة

قم بكتابة اول تعليق

أترك لنا تعليق

لن يتم نشر بريدك الالكتروني في اللعن


*


40 − 32 =