عبدالله المطيري - كاتب وعضو مؤسّس لحلقة الرياض الفلسفية، ويكتب مقالة أسبوعية في صحيفة الوطن السعودية

البيانات الضخمة وحلم النظرية الكبرى

يمكننا القول: كان العلم الحديث -ولا يزال- مدفوعاً بالبحث عن النظرية الكبرى؛ تلك النظرية التي تفسّر كل شيء، وتحلّ لغز الكون؛ ففي الفيزياء مثلاً: لم يكن مريحاً وجود نظريات متجاورة تفسّر مستويات مختلفة من الطبيعة؛ فالفيزياء النسبية تفسّر السرعات الهائلة والأحجام الضخمة، بينما تفسّر نظرية الكوانتم حركة الأجسام الصغيرة جداً، أما الحركة في المسافات الطبيعية لنا نحن سكان الأرض فقد تولّت قوانين نيوتن تفسيرها. ثلاث نظريات لمستويات مختلفة أمر ليس بالمريح؛ فالطموح والأمل في نظرية واحدة تفسّر كل شيء، وتقضي على كلّ الاختلافات بين النظريات المتوافرة حالياً. هذا الطموح والأمل تعزّزا كثيراً مع ثورة المعلومات، وقدرة الإنسان على تحصيل كمٍّ هائل من البيانات عن الواقع لم يسبق له مثيل، ومع أجهزة الحاسب والإنترنت أصبحت لدينا قدرة على رصد البيانات، وتخزينها، وتحليلها بشكل غير مسبوق

ماذا يعني امتلاك البيانات؟

بحسب مجلة Forbes، فإن سلسلة Walmart تستعدّ لإنشاء مستودعات إلكترونية لتخزين وتحليل ما يزيد على ٢.٥ بيتابايت من المعلومات كل ساعة. ويتوافر هذا المستوى في مجالات أبحاث الفلك والطب والأدوية والبيولوجيا وغيرها، والأكيد أننا اليوم نمتلك بيانات أكبر عن العالم الذي نعيش فيه، السؤال المهم هو: هل يعني ذلك أننا نملك معرفة أكبر عن العالم الذي نعيش فيه؟ لا يوجد اتّفاق على جواب محدّد لهذا السؤال؛ لأن عملية تحويل البيانات إلى معلومات عملية معقّدة، وتشهد اليوم تغييرات جذرية، بمعنى أن البيانات الضخمة لم تعُدْ تعني فقط جمع بيانات أكثر وأدقّ عن العالم، بل تعني كذلك تغيير طريقة إنتاجنا للمعرفة عن هذا العالم. واحدة من القضايا الجوهرية المتعلقة بكيفية عمل البيانات الضخمة، والمرتبطة جوهرياً بحلم النظرية الكبرى، هي أن البحوث المعتمدة على البيانات الضخمة تعمل بمنطق مختلف، وتسعى إلى هدف مختلف عن العلم التقليدي.

العلم التجريبي وعلم البيانات

سأحاول في هذا المقال إيضاح اختلاف منطق البيانات الضخمة، واختلاف غاياتها؛ لكي تكون المقارنة أوضح. ونميّز هنا بين نوعين من البحث، أو نوعين من العلم: العلم التجريبي Experimental Science، وهو العلم التقليدي القائم على استنتاج معرفة من خلال التجريب، وعلم البيانات Data Science، وهو العلم القائم على اتخاذ قرارات بناءً على جمع البيانات وتحليلها. يقوم العلم التجريبي على جمع البيانات بناءً على فرضية معينة Hypotheses، ويتم اختبار البيانات، وبناءً على النتائج يتمّ الحكم على الفرضية الأساسية بالقبول أو الرفض، وإذا لم تدعم النتائج الفرضية تتمّ العودة إلى صياغة فرضية أخرى، أما إذا دعمت البيانات الفرضية فيتم استنباط نتائج من تلك الفرضية. وبحسب المنطقي تشارلز بيرس مؤسّس البراجماتية، فإن هذه العملية خليط من ثلاثة أشكال من المنطق: استقرائي Inductive، واستنباطي Deductive، وتفسيري Abductive. والمنطق الجوهري والحاسم في العلم التجريبي هو المنطق الاستقرائي؛ فهو الحاكم على الفرضية التي غالباً ما تُقترح بمنطق تفسيري. يقول بيرس: ينتج العلماء فرضيات بناءً على منطقهم التفسيري من خلال النظريات المتوافرة، ثم يستنبطون من تلك الفرضيات حالات صالحة للاختبار، ثم يُجرون الاختبار الاستقرائي الذي له الحكم الحاسم على الفرضية. في المقابل، تبدو الإجراءات في علوم البيانات مختلفة؛ إذ المنطق التفسيري Abductive reasoning هو السائد. والمنطق التفسيري نوع من التخمين (الربط المحتمل بين المقدمات والنتائج) المبنيّ على معلومات معينة. ولا تؤدي هذه المعلومات بالضرورة إلى التخمين المقترح، لكن هذا التخمين يبدو مناسباً لما نعرفه عن الحالة المقصودة؛ فالتخمين هنا -كما يؤكد روب كيتشن- لا يعتمد على النظريات بقدر ما يعتمد على الارتباطات التي تظهرها البيانات. ومن أمثلة إيضاح المنطق التفسيري: عند ازدحام السيارات في الطريق، وانخفاض سرعة السير، فإننا نفسّر ذلك عادةً بوجود حادث في الطريق؛ فهذا التفسير ناتج من خبرة سابقة، لكننا بالتأكيد لا نملك ضمانات على صحته. هذا المنطق مهمته الأساسية التفسير، بينما المهمة الأساسية للمنطق الاستقرائي هي الوصف؛ لذلك فالمنطق التفسيري يعكس معرفتنا الخاصة والشخصية أكثر من المنطق الاستقرائي الذي يعكس لنا الواقع بشكل أكثر موضوعية.

الهدف هو اتّخاذ القرار

الذي يحدث في علوم البيانات هو اتّخاذ قرارات بناءً على المعلومات المتوافرة، والهدف هنا ليس إنتاج نظرية أو قانون بقدر ما هو قرار أو إجراء يتّسق مع البيانات المتوافرة؛ فمثلاً: تستخدم شركة أمازون البيانات الهائلة التي تجمعها من خلال العمليات التي يقوم بها الزبائن لتتخذ قرارات تتعلق بعملية تسويق منتجاتها، وتقديم اقتراحات بناءً على تحليل البيانات، ويمكننا القول هنا: إن أمازون ليست مهتمة بالوصول إلى نظرية عن السلوك البشري بقدر ما هي مشغولة بالبحث عن أعلى دقة ممكنة للتنبؤ بسلوك المستهلكين، وتوجيه هذا السلوك. الردّ المتوقّع على النقطة الأخيرة (مثال أمازون)، وهو ما قدّمه الدكتور ماجد السرحي في محاضرته عن البيانات الضخمة ضمن أنشطة حلقة الرياض الفلسفية (حرف)، هو أن علوم البيانات تشمل مجالات أوسع من شركات التسويق؛ مثل: البحوث الطبية، والبحوث الفلكية، وغيرها. هذا الأمر صحيح، لكن هذه الحقيقة تضعنا أمام طريقتين في التعامل مع هذه البيانات الضخمة: منطق التفسير واتخاذ القرارات، وهو ما يعني أنها تعمل بالمنطق ذاته الذي تتعامل به أمازون وجوجل وغيرها، أو منطق العلم التجريبي، ونكون هنا أمام تغيير في الدرجة، وليس تغيّراً في النوع، بمعنى أن الذي حدث أننا فقط أمام معلومات أكثر من السابق، أما منطق البحث فلا يزال كما هو. ويرى كريس أندرسون في مقالته (موت النظرية) أن الكم الهائل من المعلومات يفرض علينا التعامل معها رياضياً وتحليلهاً رياضياً، أو بطريقة أخرى: الحاسب الآلي هو الفاعل في علوم البيانات، وليس الإنسان؛ فمترجم جوجل -مثلاً- يترجم بين اللغات من دون أن يعرف حقيقة هذه اللغات، والعلم -كما يقول أندرسون- يقوم على التفريق المهمّ بين السببيةCausation  والارتباط Correlation؛ فارتباط (أ) مع (ب) لا يعني بالضرورة أن أحدهما سبب للآخر؛ لذلك فالعلم يبحث عن معرفة أعمق من مجرد الوصف الرياضي للبيانات للتفريق بين السببية والترابط. وفي المقابل، يتخلّى علم البيانات -كما يذكر أندرسون- عن مفهوم السببية، ويرى أن الارتباط يكفي.

الأمل في نظرية واحدة

السؤال المهم هنا هو: ماذا تعني هذه الاختلافات بين العلم التجريبي وعلم البيانات؟ وإلى أيّ حدٍّ يجب أن نعدّل في توقعاتنا بناءً على هذه الاختلافات؟ الأمل في نظرية واحدة تكشف لنا أسرار العالم هو أمل تولّد لدينا من تجربتنا مع العلم التجريبي في نسخه الفيزيائية والحيوية؛ فالعلم التجريبي يبحث فعلاً عن هذه النظرية من خلال بحثه عن العلاقات السببية التي تنظّم قوانين الكون وقوانين الحياة، وهل هذا الهدف لا يزال مستمراً مع علم البيانات الذي يسعى إلى كشف الارتباطات من أجل اتخاذ قرارات تنفيذية؟ لستُ متأكدا من هذا الأمر؛ فالنماذج التسويقية أكثر وضوحاً في الابتعاد من مثل هذا الأمل؛ لأنها غير مشغولة فعلاً بالخروج بنظريات بقدر ما أنها مشغولة باتخاذ قرارات تنفيذية تختلف باختلاف سيل البيانات الجارف.

اضف تعليق

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *