لتعامل أكثر فعالية مع البيانات دروس وخلاصات عملية من السوق السعودي

يُلاحظ مَن يتابع سوق الأعمال في المملكة العربية السعودية خلال السنوات الثلاث الماضية تنامي الاهتمام بالبيانات والقرارات المتعلقة بها. ويمثّل هذا الاهتمام امتداداً لواقع الأسواق العالمية التي باتت تعتمد بشكل كبير على جمع البيانات، ومعالجتها، وتحليلها كيفما استطاعت؛ لضمان مواقع متقدمة في المنافسة. ولكأننا نعمل في قطاع تحليل البيانات، واستخلاص القراءات المهمة منها للأعمال، تكوّنت لدينا مجموعة من الخبرات والخلاصات التي رغبنا في مشاركتها مع المهتمين والعاملين في أيّ مجال يعتمد على البيانات؛ إيماناً منا بأنها ستوفّر الوقت والجهد على بعض المهتمين، وتثري خبرة بعضهم الآخر. كما أننا نطمح إلى أن تتحول هذه الخلاصات والأفكار إلى أدوات فاعلة لدعم اتخاذ القرار، وتطوير منتجات بيانات مبتكرة في السوق السعودي.

نسلّط الضوء على أربعة جوانب تؤثّر في مدى الاستفادة من البيانات وصناعة القرار في الوزارات والمنظمات والشركات من وحي تجربتنا وخبرتنا في السوق السعودي. يتعرّض الجانب الأول لأهمية سرد القصص بالبيانات Data Storytelling ، وهو الأسلوب الذي برزت أهميته بوصفه أحد أنجع الوسائل في شرح القراءات التي تمّ استخلاصها من البيانات، وترشيح القرارات التي قد تنتج منها. وننتقل بعد ذلك إلى جانب مؤشرات الأداء؛ لنقدّم أبرز الخلاصات التي توصّلنا إليها بعد العمل عن قرب مع العملاء الذين يطمحون إلى بناء القرارات اعتماداً على قراءات المؤشرات. ونتحدث في الجانب الثالث عن البيانات المفتوحة والفوائد الجمة التي يمكن لأيّ جهة الاستفادة منها، وتحديداً في تعويض نقص البيانات التي تملكها. وختاماً، نطرح ثقافة البيانات، ونسرد أهم التجارب التي خلصنا إليها. وحاولنا دعم شرحنا بأمثلة عملية، وأن نتحاشى التنظير قدر الإمكان. ونسعد بالتواصل مع كلّ من يبدي اهتماماً للتعاون، أو الاستزادة من العمل الذي طرحناه.

سرد القصص بالبيانات

يعدّ عرض البيانات باستخدام لوحات المعلومات Dashboards من أهم التقنيات المتطورة في الوقت الحالي لتقديم القراءات المهمة المستخرجة من كمّ هائل من البيانات على شكل رسوم بيانية وإحصاءات يسهل استيعابها وفهمها. ومن الممارسات الشائعة جداً محلياً وعالمياً في لوحات المعلومات عرض نتائجها وإحصاءاتها بشكل قائم على الأرقام المجردة، وعدم التركيز بشكل كافٍ فيما يربط المعلومات بعضها ببعض بصيغة تجعلها قابلة للإقناع والتنفيذ Actionable ، وتدعم صناعة القرار.

لقد علّمتنا الخبرة التي اكتسبناها في السوق أن لوحات المعلومات الأكثر فعالية وتأثيراً لدى صانع القرار هي تلك التي تحتوي سيلاً متناسقاً من الرسائل المدعومة بالرسوم البيانية والإحصائيات، والمنسوجة في سردية قصصية. كما أن القصة تخاطب العاطفة لدى المتلقي؛ فهي أيضاً تخاطب تحيزاً عقلياً موجوداً لدى جميع البشر يُسمى (التحيّز السردي Narrative Bias)، وهو ميلنا بوصفنا بشراً إلى ربط الحقائق والمعلومات التي نعيها وترتيبها في إطار سردي يفسّر العلاقة بينها. باختصار: نحن نرى العالم ونفسّره بسرديات وقصص خاصة بنا، قد تكون قاصرة، وقد تكون محقة.

ومن دون الخوض في تفاصيل الموضوع يكفينا التركيز في أهمية القصة في توصيل النتائج التي خلصت إليها البيانات، وأثرها في مساعدة صانع القرار على انتقاء أفضل القرارات؛ فأهمية القصة في عالم البيانات أوجدت مجالاً مهماً بات يُعرف بـ(سرد القصص بالبيانات Data Storytelling). ونستعرض في هذه المقالة مثالاً عملياً لشرح خطوات بناء القصة بالبيانات، مستعينين بإحدى أشهر المنهجيات المتبعة في هذا الموضوع، التي وضعتها خبيرة الأعمال كول نافلك(1)؛ ففي موضوع عرض عن (الحوادث المميتة في مدينة الرياض)؛ أي: الحوادث التي تتضمن حالات وفاة، سنفترض أن الجمهور هم الجهات المعنية بالمرور والخدمات الصحية، والهدف من العرض هو مساعدتهم على تحديد الأمكنة التي تنتشر فيها الحوادث المميتة؛ ليقوموا بعمل اللازم من إعادة تنظيم تلك الشوارع، وتوفير وحدات أمنية وصحية قريبة، وتنظيم حملات توعوية تستهدف تلك المناطق، وغيرها.

– الخطوة الأولى.. تحديد الجمهور:


كانت الخطوة الأولى هي تحديد الجمهور، والتعرّف إليهم، وفهم السياق العام للمشكلة المهمة. ويتضمن ذلك الإجابة عن أسئلة من نوع: مَن هم الجمهور؟ بهدف معرفة خلفياتهم وتحيّزاتهم وأدواتهم التحليلية الفكرية، وماذا يريدون؟ لفهم طبيعة القرار أو التحرك النهائي المراد اتخاذه منهم، وهل يتضمن ذلك فتح نقاش معهم من أيّ نوع؟ وكيف يمكننا مساعدتهم؟ وهنا تتم دراسة البيانات المتاحة، وتحديد مدى قدرتها على توفير أساس لحل المشكلة المهمة التي تتم دراستها.

وتتضمن دراسة الجمهور معرفة خلفياتهم، ومدى اطّلاعهم على المشكلة نفسها. وقد طوّر جيم ستيكليثر -الرئيس التنفيذي للإبداع في شركة DELL– في مقال مميز(2) نُشر في Harvard Business Review تقسيماً مقترحاً للخطاب المناسب لكلّ نوع من أنواع الجمهور بالشكل الآتي:

طبيعة المتلقي

مبتدئ Novice

نوعاً ما، ليس لديه خلفية عن هذا العرض

مطّلع

Generalist،

لديه معرفة إجمالية بموضوع العرض

إداري

Managerial،

لديه معرفة واسعة بالموضوع، ويملك صلاحية صناعة القرار

خبير Expert،

لديه معرفة تخصّصية دقيقة بالموضوع

تنفيذي

Executive،

لديه معرفة بالموضوع بالقدر الذي يكفي لرؤية تأثيره في مستوى المنظمة كلها

محتوى العرض المقترح

قصة بيانات تعريفية من دون إفراط في التفاصيل

قصة بيانات تدخل مستويات تفصيلية أعمق تقدّم مزيداً من الفهم والتوضيح وأبعاد الموضوع

معلومات تفصيلية مدعمة بتحليلات لدراسة العلاقات تساعد على اتخاذ قرارات تنفيذية

تحليل استكشافي واستنباطي يساعده على كشف دلالات وخفايا الأمور، ويحتاج إلى معرفة التفاصيل، ولا حاجة فعلية إلى سرد قصصي بالبيانات

لأنه ليس لديه وقت كافٍ لاستعراض التفاصيل يجب أن يركّز المحتوى في النتائج، ومدى تأثيرها (يمكن استخدام قالب السرد القصصي بالبيانات)

الحوادث المميتة في الرياض موضوع مهم؛ لذلك يجب أن تدعم البيانات البعدين الزماني والمكاني للحوادث؛ لأن ذلك من شأنه مساعدة الجهات المعنية على التخطيط بشكل أفضل. لكن للأسف بيانات الحوادث التي تضمنت حالات وفاة غير متاحة لعامة الناس على مستوى الحادث الفردي باستثناء الرقم الإجمالي، وهو 448 وفاة عام 2014م(3)، و858 وفاة عام 2015م(4)؛ لذلك قمنا بتوليد بيانات وهمية من ناحيتي الزمان والمكان للحوادث، لكن بعددٍ مطابقٍ لعدد وفيات الحوادث الإجمالي في الرياض، بافتراض أن كلّ حادث تصاحبه حالة وفاة واحدة، وهو افتراض قاصر، لكنه حتمي لعدم توافر البيانات التفصيلية لدينا.

قبل الانتقال إلى الخطوة الثانية، من المهم التنبّه إلى خطأ شائع يقع فيه كثير من محللي البيانات في هذه المرحلة، وهو الرغبة في عرض مسيرة العمل للجمهور، تلك المسيرة التي تمّت فيها دراسة البيانات، ومعالجتها، وتحليلها، وإعداد النتائج؛ بهدف إبراز التحديات التي واجهها المحلّلون، وكيف تغلّبوا عليها، وفي الأغلب يكون ذلك على حساب إبراز النتائج نفسها التي تهم الجمهور؛ لذلك يتمّ تشتيت انتباه المتلقّين بأمور لا تهمهم.

– الخطوة الثانية.. انتقاء الرسوم البيانية المناسبة:


يتمّ في هذه الخطوة التركيز في انتقاء الرسوم البيانية المعلوماتية، التي تؤدي الرسالة المراد توصيلها. ومع الثورات التي شهدتها أدوات ومكتبات عرض البيانات، وعلى رأسها
D3.js، بات من الممكن تطوير واجهات عرض بيانات تصبح أقرب ما يكون إلى اللوحات الفنية المبهرة، لكن يبقى من المهم التركيز في انتقاء ما يناسب الرسالة المراد توصيلها، حتى لو كان ذلك باستخدام الأشكال المستخدمة بكثرة، حتى المستهلكة منها؛ كالأعمدة البيانية Bar Chart؛ ففي النهاية تبقى هذه العناصر أكثر ألفةً لدى المتلقي، وأسهل للفهم؛ لذلك قمنا بتطوير لوحة معلومات تفاعلية تستخدم عناصر بيانية بسيطة لتوصيل الأفكار.

وينبغي هنا تحاشي الأشكال التي يصعب المقارنة بين أحجامها بسبب احتوائها على زوايا؛ مثل الـPie Chart، والـDonut Chart، إضافةً إلى الأشكال الثلاثية الأبعاد؛ لأنها تشتّت الانتباه أكثر من الفائدة التي تحقّقها(5)، وينطبق ذلك على الأشكال المتعددة المحاور Multi-Axis Charts. لكن على الرغم من التحديات التي قد تصاحب استخدام الـ Pie Chartsإلا أنها تبقى قادرةً على توصيل الرسائل بحسب السياق وطبيعة البيانات؛ لذلك من الممكن استخدامها بحذر؛ ففي مثالنا عن حوادث الرياض قمنا بانتقاء تقنية الخرائط الحرارية المتحركة Animated Heatmaps(6) لعرض الحوادث على خريطة الرياض لتوصيل القصة بشكل أكثر تأثيراً.

– الخطوة الثالثة.. إزالة التداخل والتعقيد البصري في لوحة البيانات والأشكال البيانية:

من المهم التنبّه الى مفهوم الحِمل الإدراكيCognitive Load (7)، وهو قدرة عقولنا على استيعاب ما يعرض أمامنا؛ فهذا الحِمل له حدود، وتُضاف إليه تحيّزاتنا العقلية، وعلى المحللين ومطوّري تقارير الأعمال مراعاة هذا المبدأ لتحقيق نتائج أفضل، والتقليل من التشتت الممكن حدوثه لدى الجمهور. ويتم ذلك عبر دراسة وتطبيق ما يُعرف بمبادئ غشتالت Gestalt Principles(8)، التي تحدد أساليب رصف الأشكال البيانية بشكل يرشّد من استهلاك الحِمل الإدراكي.

– الخطوة الرابعة.. توجيه تركيز الجمهور نحو عناصر معينة لتعزيز الاستيعاب:

يتم ذلك بتعديل الألوان والأحجام والحركة والنصوص المتعلقة بعناصر لوحة البيانات لتتماشى مع المحتوى السردي للقصة، وما يُراد توصيله من نقاط مثيرة للاهتمام؛ فمثلاً: تلوين عمود بياني معين يقع بين مجموعة من الأعمدة بلون مغاير مع كتابة القيمة في حقل نصي بمظهر متباين عن البقية يؤثر في كيفية تنبّه واستيعاب الجمهور للمغزى الذي يحمله هذا العمود.

– الخطوة الخامسة.. بناء القصة:

يتكون الأسلوب التقليدي والأكثر شهرة لبناء القصة من:

المقدمة/ الشخصيات

الحبكة/ العقدة

الحلّ/ النهاية

التأسيس للقصة والشخصيات والعناصر المحيطة، وينتهي هذا القسم بحدث مفصلي يوضّح أن حياة بطل القصة ستنعطف نحو طريق جديد، وأن حياته بعد الحدث لن تكون مماثلة لما قبله

التفاصيل التي تبرز تعقيد الوضع، والتضحيات، والتحديات، والأحداث غير المتوقعة، والصراعات

مرحلة استعادة الأمل بحلّ مشكلات جزئية، وإجراء تسويات تكلّل بحلّ المشكلة الأساسية

في مثالنا عن حوادث الرياض يمكن توليد عرض تقديمي Presentation يروي القصة الآتية (هنا نشرح الفكرة عامةً؛ فليس هناك مجال لعرض صفحات العرض التقديمي المقترح بالتفصيل)، مع ملاحظة أنه عند كل علامة (*) يجب أن يحتوي العرض على أبرز الإحصائيات والأرقام التي تؤكّد الجملة الواردة مع المصادر:

– المقدمة/ الشخصيات:

تعمل الجهات المعنية دائماً على توزيع ونشر الوحدات المرورية والطبية بشكل يحدّ من حوادث الطرق داخل الرياض وخارجها، ويلاحظ المواطنون والمقيمون الانتشار الكثيف لتلك الوحدات بشكل خاصّ في أثناء المناسبات والفعاليات العامة، لكن يبقى ارتفاع أعداد وفيات الحوادث في كلّ سنة ملحوظاً، وهو ما يشكّل هاجساً لدى الجهات(*). وقد أحدث نشر تقرير عن هذا الموضوع في صحيفة محلية شهيرة جدلاً حاداً على وسائل التواصل الاجتماعي يطالب الجهات المعنية بنشر وحداتها بشكل أوسع، مع فرض قوانين أكثر صرامة على متجاوزي السرعة والمستهترين في الطرقات.

– الحبكة/ العقدة:

زاد الجدل بعد وفاة أحد المقربين من مشاهير تويتر وإخوته في حادث مروري، وعاد إلى الانتشار مقطع فيديو نُشر عام 2010م عن وفيات حوادث السيارات في المملكة، وأن أغلبها يحدث داخل المدن، وليس خارجها، بعكس الاعتقاد السائد، وقد سُمِّي المقطع بـ(إرهاب الشوارع)(*). وإذا نظرنا إلى البيانات السابقة عن الحوادث المميتة يتّضح أن الشخص الشهير تُوفِّي في منطقة تكرّرت فيها حوادث مميتة في الوقت نفسه تقريباً(*). كما تكشف البيانات أن المراكز الطبية والمستشفيات بعيدة من هذه المنطقة بشكل يقلّل من احتماليات نجاح عملية إسعاف المصابين(*).

– الحل/ النهاية:

أظهر تحليلنا بيانات الحوادث، مع الأخذ في الحسبان الأبعاد الزمانية والمكانية وأنواع الحوادث، وعرضها على خريطة حرارية متحركة، أنه يمكن للجهات المعنية توزيع وحداتها في أمكنة نوعية تقلّل بإذن الله من 80% من الحوادث المميتة(*)، بل يوفّر عليها جهود وتكاليف نشر الوحدات في أمكنة وأوقات لا تسجّل نسب احتمالات عالية لوقوع حوادث، إضافةً إلى إمكانية قياس فعالية ما تمّ إنجازه وفهم ودراسة مسبّبات الحوادث بشكل محدّد لكل مكان وزمان على حدة مع الجهات المعنية لرصد كيفية التقليل من هذه الحوادث المميتة.

مؤشرات الأداء

المؤشر في اللغة يعني العلامة، والمؤشرات بطبيعتها تختزل تفاصيل الواقع وتبسّطها لتوضيح المآلات والدلالات العامة، كما أن المؤشرات وسيلة، وليست غاية؛ فليس الهدف تعريف عدة مؤشرات لقياس أداء إجراءات العمل Business Processes بسبب أهمية المؤشرات في حدّ ذاتها، وإنما الهدف هو تحسين الإجراءات وتطويرها؛ لذلك فمن المهم تصميم وبناء المؤشرات لتكون قادرة على مساعدة أصحاب القرار على فهم الأداء العام للإجراءات، وتمكينهم من أخذ القرارات التحسينية، وأن تكون مقيدةً بالأهداف Objective-Driven. ويمكن تقسيم مؤشرات مراقبة الأداء من خلال ثلاثة مجالات تطبيق رئيسة، هي:

تطبيقات

إجراءات العمل

المجالات التي تكون طريقة عملها مبنية على إجراءات عمل Business Processes واضحة، وتحتوي على مراحل محددة؛ كتنفيذ المشروعات، أو في أنظمة تخطيط الموارد المؤسسية ERP وغيرها، علماً أن هناك وفرة في البرامج المتخصصة في قياس المؤشرات المعروفة وتحليلها مسبقاً بناءً على أفضل الممارسات في عدة مجالات هدفها الرئيس هو كشف القصور في الإجراءات أو كيفية تحسينها.

تطبيقات

القياس المقارن

المجالات التي تتطلب توفير مؤشرات عالمية لعمل قياس مقارن Benchmarking؛ كتلك التي تتطلّبها المنظمات العالمية -كالأمم المتحدة- في الصحة العالمية، أو الرصد الحضري وغيرها لقياس ومقارنة تقدّم الدول والمنظمات، وتكون مؤشرات هذه المجالات في الأغلب معروفة ومدروسة، وهدفها تقديم مساعدة للدول لمعرفة موقعها في تطوير حياة الإنسان.

تطبيقات التحديات غير التقليدية

موضوع نقاشنا المجالات التي تتطلب تطوير مؤشرات ومقاييس لحلّ مشكلات صعبة التعريف والدراسة لاتّساع نطاقها؛ كمشكلة الإسكان، والبطالة، والحوادث المرورية، وغيرها. ويكمن التحدي في أن هذه المشكلات تعتمد بشكل مباشر على خبرات بشرية حقيقية عملت في هذه المجالات ضمن سياقات مشابهة، وغالباً ما يتم في السوق المحلي استحضار خبرات دول أو منظمات عالمية عالجت هذه المشكلات مسبقاً، والاعتماد على المؤشرات والمقاييس المبنية على المسوحات الإحصائية، أو القياس المقارن Benchmark، الخاصة بدول أخرى. وربما تكون هذه الأساليب مشجعة على إيجاد حلول وقتية سريعة، لكنها حتماً لا تقدم حلولاً جذرية أو إصلاحية بعيدة المدى تراعي طبيعة التحديات المحلية، فضلاً عن أنها مبنية في الأغلب على مقارنات غير متكافئة.

– تحديات تعريف المؤشرات وقياسها:

في أغلب الأحيان، يتم تعريف المؤشرات وما ستقوم بقياسه من جانب قطاعات الأعمال بمعزل كبير عن واقع ما تملكه المنظمة من بيانات، أو بوضع افتراضات عما تملكه المنظمة والمنظمات المتعاونة من بيانات، وتنتج من ذلك حالتان:

– الأولى: بحكم طبيعة المؤشرات الاختزالية يُغفل المحللون والمستشارون تضمين مصدر بيانات مهم جداً في حساب المؤشر، لكن تأثيره غير مباشر (كبعض البيانات المفتوحة)، وهو ما يقلّل دقة المؤشرات.

– الثانية: أن يتّضح عدم صحة الافتراضات عن توافر البيانات، وجودتها، ومحتواها، وغيرها من التحديات، وهو ما يفرغ المؤشرات من قيمتها لدى صانع القرار بعد أن تمّ رفع سقف توقعاته لما يمكنه قراءته ومتابعته.

وللحدّ من أثر كلتا الحالتين تجب مناقشة الأفكار مع المقربين من البيانات ومن يعرفون جودتها ومحدداتها؛ فمن العملي جداً تبني جانب الانطلاق من البيانات المتوافرة في أثناء تحديد مؤشرات القياس والأداء، سواء داخل المنظمة أم تلك المتوافرة في المصادر المفتوحة. ويمكننا القول باختصار: إن المؤشرات المراد قياسها يجب ألا تكون هي المنطلق الوحيد في تعريف البيانات المطلوب دراستها وجمعها، بل يتم تكميل العملية بالانطلاق أيضاً من جانب البيانات. والمطلوب دائماً في هذا التوجّه (الاتزان)؛ ليتم التعامل مع المؤشرات والبيانات الخام، وفهم الثقافة المحلية والمعوقات الحقيقية؛ حتى لا يطغى أحدهم على الآخر. ومثال ذلك أن يتم التركيز في تحسين جودة البيانات الخام، الذي قد يستغرق وقتاً طويلاً، فيقلّل أهمية المؤشرات الآنية، ويقلّل من قيمتها لدى صانع القرار. في المقابل، التركيز الزائد في المؤشر فقط قد يؤدي الى تجاهل تحديات متعلقة بالبيانات أو بثقافة موجودة، وهو ما يؤدي إلى نتائج وقراءات مضلّلة.

– نحو مؤشرات أداء أكثر فعالية:

توصّلنا بالخبرة المكتسبة عبر العمل المباشر على عدة مشروعات حكومية في المملكة العربية السعودية إلى مجموعة من الخلاصات والملاحظات في بناء مؤشرات أكثر فعالية ودقة، هي:

– تبنّي إطار عمل Framework مرن مختصّ بمؤشرات الأداء في عصر وفرة البيانات، والقدرة الفائقة على قياسها، ودمجها بالمسوحات الميدانية، ويجب أن يتيح إطار العمل مجالاً للتعديل عليه ليتمكن من التعامل بواقعية مع الثقافة المحلية وطبيعة التحديات المصاحبة؛ فقد وجدنا أن إطار العمل الذي طوّره أليستر كرول في كتابه Lean Analytics يمثّل أرضية ممتازة للانطلاق منها، خصوصاً مفاهيم دورة حياة التحليلات الرشيقة Lean Analytics Cycle(9)، وتركّز هذه الدورة في تشكيل سلسلة ديناميكية لبناء مقاييس فعالة وعملية تمرّ بمراحل: تعريف المقاييسDefine ، وبناء الفرضيات Hypothesis، والتجربة والقياسExperiment ، وصناعة وأخذ القرار Act، ونحيل القارئ المهتم بذلك الكتاب إلى الاطلاع بشكل مفصّل على إطار العمل المقترح.

– تطوير المؤشرات المرحلية والطويلة الأمد بشكل متناغم مع أولوية الأهداف، ويتم ذلك مع الأخذ في الحسبان آليات الرشاقة Agility والمرونة Resilience المهمة في تعريف وقياس المؤشرات بشكل عملي إذا كانت هناك ضبابية في الهدف العملي المراد قياسه، أو وجود تحديات مصاحبة للبيانات التي يستند إليها المؤشر (دقة البيانات مثلاً). وبالتوازي مع كلّ هذه الأنشطة، يتم وضع خطة مدروسة تعتمد على رأس المال الخبراتي المحلي في المقام الأول، مع تحديد البيانات الإدارية Administrative Data والمسوحات الإحصائية الميدانية المكملة التي تجيب عن الأسئلة الأعمق التي لا توفّرها البيانات.

– التركيز في الكيف وليس الكم في تطوير المؤشرات ذات القيمة الحقيقية التي تعتمد على الحقائق والبيانات الموجودة، وليس على الحدس البشري وتفسيراته بشكل أساسي، وهو ما يقلّل من الاجتهاد البشري الخاطئ غير المقصود في الأغلب، ويصاحب ذلك فلترة وحذف المؤشرات التي لا قيمة لها مع الوقت.

– دعم ثقافة البيانات بتكوين مؤشرات متنوعة قابلة للقياس، والتقييم المستمر، والاستفادة من جميع الخبرات لبناء مؤشرات تجيب عن الأسئلة المرتبطة بالأعمال، ويمكن مراجعة القسم الخاص بثقافة البيانات لمعلومات أكثر عن هذا الموضوع.

– دعم ثقافة التجربة بشكل ممنهج يدعم إضافة التفسيرات بشكل واقعي، ثم بناء توجهات بحسب ما تم قياسه وتجربته؛ لأن نمو مثل هذه الثقافة يصنع استمرارية للمنظمات، ويخلق بيئة إبداعية لمواكبة التغيرات، وهو أمر لا بد له أن يتم عبر عمليات تتضافر فيها جهود عدة فرق محسوبة على الجوانب التقنية والعملية بشكل يوازن بين أدوار خبراء البيانات Data Experts والأعمالBusiness SMEs ، وغيرها.

– بناء وتطوير المؤشرات بطريقة تكرارية Iterative ودورية Cyclic تراعي التطور الحاصل في متطلبات العمل.

– العمل باستمرار على معالجة جودة البيانات، وتحسينها، واكتمال تصنيفاتها Taxonomies؛ فالبيانات هي الأساس الذي تُبنى عليه المؤشرات؛ لذلك فإن آليات المعالجة والتحسين القاصرة قد تؤدي إلى قراءات مضلّلة للمؤشرات (مثل: استحداث تصنيف  Unknownبوصفه ترميزاً خاصاً بالجنايات التي لم تكتمل معلوماتها، وعند بناء مؤشر عن عدد الجرائم تم استبعاد هذه الجنايات؛ لأنها لا ترقى إلى وصفها بالجرائم، وهو ما أثّر بشكل مباشر في مؤشر أداء الجريمة، وجعله أكثر دقة، بعد أن كان يتم تضمين جميع سجلات البيانات من دون استثناء بفرض أن ما يسجل في الجدول هو بالضرورة جريمة).

– المؤشرات وتحليلات التوجيه:

من المهم توظيف تقنيات التحليل المتقدم، أو تحليلات التوجيه Prescriptive Analytics، خلال دورة تطوير مؤشرات القياس التي تعتمد على استخدام خوارزميات رياضية تسمى Simulation and Optimization. ويكمن دور هذه التقنيات في محاكاة الواقع، ومعالجة كل ما يؤثر في مؤشرات الأهداف المراد تحقيقها بشكل استباقي، ثم تزويد صانع القرار بأفضل الحلول؛ فمثل هذه التحليلات تحوّل مؤشرات القياس التي تم تطويرها من لوحة صامتة تنتظر المستقبل ليغيّر قراءاتها إلى عملية تفاعلية تتنبأ بالمخاطر المستقبلية، كما أن صناعة توجهات مختلفة تتعامل مع المخاطر يدعم تحقيق الهدف المطلوب. ومن الأمثلة المشهورة التي تطبّق هذه التقنيات استخدام آليات البرمجة الخطية وغير الخطية Linear and Nonlinear Programming في تحديد الأولوية والترتيب المثاليين للمشروعات التي ترغب في تنفيذها الجهة ضمن حافظة مشروعاتها Project Portfolio Management بما يضمن تحقيق أعلى العائدات، وأقلّ الخسائر. ومن المؤكّد أن كلّ منظمة أو وزارة لديها كثير من المبادرات التي تسعى إلى تنفيذها خلال السنوات الخمس المقبلة، وترتبط هذه المبادرات بشكل مباشر بالقدرات البشرية المحدودة لديها، إضافةً إلى توافر الدعم المالي من عدمه. وتساهم مثل هذه التحليلات في ترتيب الأولويات بهدف التنفيذ الناجح، وربط اعتمادية ومتطلبات كل مبادرة بالموارد المتاحة، وإيجاد برامج موزاية لإيجاد حلول للتحديات المستقبلية؛ كالتوظيف، والتدريب، وتوافر الموارد المالية، وغيرها.

التعامل مع البيانات المفتوحة

البيانات المفتوحة هي البيانات المتاحة لعامة الناس، التي يحقّ لأيّ أحد استخدامها، وتحليلها، وإعادة نشرها مع الإشارة إلى مصدرها الأصلي. وتزخر شبكة الإنترنت اليوم بالمواقع التي تحتوي على بيانات متاحة للعامة في شتى المجالات قابلة للتحميل والمعالجة الفورية، ويفتح ذلك مجالاً لتطوير حياة المجتمع اليومية عبر اكتشاف القراءات والأنماط التي تحملها البيانات، ثم بناء تطبيقات مبتكرة وإبداعية، سواء أكانت تجارية أم غير ربحية، وهو ما شجّع كثيراً من الحكومات في العالم على إطلاق مبادراتها الخاصة بالبيانات المفتوحة للجميع.

والفكرة الجوهرية في فلسفة البيانات المفتوحة هي الإيمان بأن الجمهور يمكنه تقديم تحليلات وحلول إبداعية من البيانات، وأن الموضوع لم يعد حكراً على النخب والمتخصّصين. وتتنوّع التجارب التي تظهر فيها بشكل جليّ النجاحات التي نتجت من التوظيف الإبداعي للبيانات المفتوحة، الذي أتى من رحم الإبداع الجماهيري، وليس النخبوي؛ فمثلاً: يعتمد موقع Locrating على البيانات المفتوحة للتعليم في المملكة المتحدة لعرض مواقع المدارس على الخرائط الجغرافية التفاعلية وتقييمها للاستفادة من تجارب الآخرين، وتوفير الجهد والوقت في عملية البحث عن مدرسة مناسبة. وهناك مثال آخر يوضّح كيف أن فكرة أتى بها الجمهور ووضعها حيّز التنفيذ وفّرت ملايين الجنيهات البريطانية على الدولة هو موقع PrescribingAnalytics الذي طوّره تحالف من أطباء وشركات تقنية في المملكة المتحدة، ويتم فيه الاعتماد على بيانات هيئة الخدمات الصحية الوطنية NHS المفتوحة بهدف اقتراح بدائل دوائية لها الفعالية ذاتها لأدوية أخرى، لكنها أقل ثمناً؛ فأدى ذلك إلى خفض تكلفة أسعار الوصفات الطبية التي تصفها الأجهزة التابعة للهيئة بشكل كبير، وهو ما أدى إلى ترشيد نفقات النظام الصحي البريطاني. كما أن هناك مثالاً آخر قام به باحثون بعنوان: Tracking Employment Shocks Using Mobile Phone (Data)(10) لدراسة سلوكيات مستخدمي الهاتف النقال، وبحثت الدراسة في عدة جوانب متعلقة بالسلوكيات؛ مثل: عدد المكالمات المرسلة والمستقبلة، وكيفية انخفاضها مكانياً وزمانياً، وكيفية تفاعل المستخدم مع المجتمع عبر الهاتف لاكتشاف معدل البطالة بطريقة مبتكرة باستخدام عينات عشوائية.

ومحلياً، هناك عدة مبادرات ومشروعات تقدّم بيانات مفتوحة للعامة، أبرزها موقع البيانات المفتوحة في المملكة، ونظام الإحصاء التفاعلي التابع للهيئة العامة للإحصاء السعودية، كما تنشر عدة جهات حكومية أبرز إحصاءاتها، مثل: وزارة الصحة، ووزارة العمل، ووزارة العدل. وعلى الرغم من الفوائد الجمة التي تقدمها هذه المبادرات إلا أن هناك عدة تحديات متعلقة بها تحدّ من فعاليتها والتطبيقات التي يمكن تحقيقها من خلال بيانات هذه المبادرات، لعل أهم هذه التحديات:

– جودة البيانات ودقتها.

– استمرارية تدفق البيانات ونشرها بشكل دوري.

– إتاحة البيانات بصيغ قابلة للتحليل، بدلاً من إتاحتها بصيغة PDF، مع معالجة أبرز مشكلات البيانات كأخطاء التصنيف Taxonomy.

– محدودية القدرة على تحصيل البيانات عبر واجهة برمجة التطبيقات API لدعم بناء أفكار إبداعية وشركات ناشئة تعتمد على التحصيل الآلي للبيانات.

– عدم توفير البيانات على شكل سجلات ذات دقة فردية High Granularity؛ لأن توفيرها على شكل تقارير أو إحصاءات مجمعة Aggregated لا يدعم الهدف الحقيقي من البيانات المفتوحة، كما أن توفير وثيقة للخصوصية تدعم هذه الأفكار يساعد الجهات الحكومية وغير الحكومية على المساهمة في توفير البيانات المفتوحة.

وبوصفنا مهتمين بالبيانات وتحليلها، فكثيراً ما نصطدم بواقع شحّ مصادر البيانات، وعدم توافر البيانات بصيغ قابلة للتحليل المباشر، لكن علّمتنا الحكمة المعروفة (ما حكّ جلدك مثل ظفرك، فتولّ أنت جميع أمرك) أن نقوم بدراسة مواطن البيانات المفيدة لأهدافنا، وأن نقوم بسحب البيانات من مصادرها بشكل مباشر بتوظيف آليات حصد البيانات Web Scraping and Crawling، ثم معالجتها بشكل آلي إجملاً، وتوظيفها فيما نريد.

ويعدّ قطاع العقارات في المملكة من أكثر القطاعات التي تهمّ المواطنين، الذين يرغبون دائماً في متابعة أخباره وتطوراته، ويظهر ذلك جلياً في عدد المواقع السعودية التي تهتم بالعقارات، ويُعنى روادها بنشر عروض بيع وتأجير بوتيرة عالية يومياً؛ فلمعرفة وتيرة العروض العقارية في الرياض -بحسب الأحياء مثلاً- يهمّنا تحصيل البيانات المتعلقة بالعقارات ودراستها، ولعدم توافر مصدر معين يتيح بيانات من هذا النوع قرّرنا الاستعانة ببيانات موقعين شهيرين يستخدمهما المواطنون في نشر عروض البيع والتأجير، هما: عقار، وعقار سيتي؛ فلموقع عقار سيتي قمنا ببناء برنامج مكتوب بلغة جافا يقوم بالمرور على جميع صفحات الموقع بشكل آلي لعمل HTML Parsing ، وراعينا في البرنامج توظيف أساليب برمجية لا ترهق خادمات الموقع، وتتم معالجة نصوص العروض العقارية Text Mining بهدف تحديد الأحياء التي يتبع لها كل عرض. أما لموقع عقار فتم استخدام موقع شهير يسمى import.io(11) يسهل من عملية حصد البيانات من دون كتابة أكواد برمجية، وساهم موضوع الوسوم Tags المرتبطة بكلّ عرض عقاري في معرفة اسم الحي مثلاً من دون الحاجة إلى تحليل النصوص كما في الموقع السابق، وتم استخدام برنامج Trifacta (12) في عملية معالجة البيانات وتصحيح جودتها قبل دمجها مع القراءات، وتم استخلاصها من موقع عقار سيتي. وتجدر الإشارة هنا إلى أن الاهتمام العالمي بالبيانات المفتوحة أدى إلى ازدهار سوق المواقع والمنتجات التي تسهل على المستخدم عمليات تحصيل ومعالجة وتحليل وعرض البيانات من دون الحاجة إلى كتابة أكواد برمجية بشكل لم يسبق له مثيل. ومع اكتمال البيانات المطلوبة لاحظنا في أثناء دمجها أن العروض العقارية لا تتداخل بشكل كبير بين الموقعين؛ أي أن يكون الإعلان/ العرض العقاري نُشر في كلا الموقعين للعقار نفسه، وهو ما يجعل فرضية أن لكلّ موقع جمهوره فرضية مقبولة نوعاً ما، وهي تعفينا إلى حدّ كبير من معالجة البيانات بشكل إضافي للتعامل مع العروض المكررة.

ويأتي التحدي الكبير في موضوع عرض النتائج؛ لذلك بحثنا كثيراً عن خريطة أحياء الرياض بصيغة مناسبة لأدوات العرض، سواء Shapefiles أم GeoJson، لكننا لم نجدها، مع علمنا بوجودها لدى جهات رسمية معينة، لكنها غير متاحة للعامة؛ لذلك قمنا ببناء خريطة أحياء الرياض بأنفسنا، وهي تزيد على 163 حياً، باستخدام أحد أنظمة معلومات الخرائط GIS المفتوحة المصدر، واسمه QGIS(13). وبعد ربط الخريطة ببيانات العروض العقارية المنشورة في موقعي عقار وعقار سيتي تشكّلت لدينا خريطة تغطّي بياناتها سنة واحدة من العروض من يونيو عام 2015م حتى يونيو عام 2016م.

لا تتوقّف أفكار توظيف البيانات المفتوحة عند هذا الحد؛ فالمجال مفتوح بشكل كبير لبناء تطبيقات عقارية تستفيد من هذه البيانات لتوليد إحصائيات ومؤشرات تفيد الجهات الحكومية والخاصة والأفراد بشكل مباشر؛ فمثلاً: يمكن الاستفادة من معلومات تخصّ العقار نفسه؛ كعدد الغرف، ونمط التصميم، في دراسة تفضيلات الباحثين عن سكن، كما أن دراسة أسعار العقارات المعروضة عبر الزمن تفيد في بناء مؤشرات عقارية تهمّ صناع القرار والأفراد، وجمعنا كذلك لبيانات تمثّل جانب (العرض) في سوق العقار يمكّننا من استخدام بيانات أخرى تمثّل (الطلب) في السوق، وأحد أهم تطبيقات ذلك هو تحديد ما يُعرف لدى العقاريين بالمربع الذهبي لكل حيّ، وهي المناطق الأفضل والأعلى سعراً في كلّ حي من جانب (الطلب)، وليس (العرض) فقط، وهو ما يقلل من فرص التلاعب في أسعار العقارات، وفرضها على الباحثين عن سكن.

ما عرضناه هو مجرد البداية، وفضاءات التحرّك، وتوظيف البيانات المفتوحة المتوافرة على الإنترنت واسعة لمن يرغب في استخدامها، لكن بطبيعة الحال الطريق ليست معبّدة، وإنما مملوءة بالتحديات.

ثقافة البيانات

أفاد 81% من صانعي القرار في شركات تقنية تعمل في السوق السعودي بأن أكبر عائق أمام التعامل مع أولويات الأعمال، ومجاراة تغيراتها، هو العائق الثقافي (ثقافة السوق والأعمال)، بحسب دراسة قامت بها شركة EMC، وهذه النسبة الكبيرة لها ما يسوّغها؛ فعدم وضوح العوائد المتوقعة للاستثمار في تقنيات جديدة لمجاراة السوق، أو التخوف من عدم جاهزية الشركة لتغيير كبير، أو التخوف من خوض غمار تجربة عالية المخاطر قد تضرّ الشركة أمام منافسيها، وكلّ ذلك من شأنه تشكيل عائق أساسي أمام التعامل مع أولويات الأعمال والحاجات الجديدة للسوق. وفي المقابل، ومع تفهمنا هذه العوائق، يجب ألا تستبدّ المخاوف بشكل يجعل الشركة تقع في حالة طويلة من الجمود من دون محاولة الاستمرار في فهم أولويات السوق، وبناء القدرة الذاتية على التعامل معها، ثم الانتقال إلى وضع أكثر تنافسية وفتح آفاق جديدة. ونعتقد أن هذا الجمود (الناتج من عوامل داخل الشركة وخارجها) هو ما يستاء منه صناع القرار المشاركون في دراسة EMC. وينطبق ذلك على إحدى أهم الأولويات في مجال الأعمال، التي برزت أهميتها في الأعوام القليلة الماضية، وهي البيانات؛ إذ تقوم ثقافة البيانات؛ أي: معرفة طبيعتها وأهميتها وتطبيقاتها وتوظيفها في معظم القرارات التي تتخذ في الشركة، على تغيير عقلية التعامل مع البيانات من مجرد أرقام مختزنة في قواعد البيانات إلى جعلها أصلاً من أصول الشركة الإستراتيجية Data as a Strategic Asset. وهذا التغير في العقلية والنظرة نحو البيانات يصحبه فعل وآليات وأنشطة حقيقية. صحيح أن الواقع إجمالاً يخبرنا بالعكس؛ ففي دراسة لغارتنرGartner  ذكر أن 80% من الرؤساء التنفيذيين لشركات تعمل في قطاعات متنوعة استحدثوا آليات وخططاً تتعامل مع البيانات بوصفها أصلاً إستراتيجياً من أصول الشركة، لكن 10% منهم فقط قالوا: إنهم يتعاملون فعلياً مع البيانات على هذا الأساس؛ أي: يحوّلون الخطط إلى واقع ملموس. لن نتحدث بالتفصيل عن ثقافة البيانات؛ فنحن نفترض أن القراء لديهم إلمام متقدم بها، لكننا سنقوم بسرد بعض النقاط التي خلصنا إليها بالخبرة التي بنيناها في السوق، والتي تركز في سبل تفعيل ثقافة البيانات إلى واقع ملموس:

– تفعيل ممارسات الاعتماد على البيانات في القرارات التفصيلية، ومراجعة التقارير والأرقام بشكل شبه يومي، ويشمل ذلك التقارير المستندة إلى بيانات المنظمة الداخلية، والتقارير المنشورة من جهات أخرى.

– تعزيز الحوكمة في المنظمة لحلّ مشكلات جزر البياناتData Silos ، وملكية البيانات Data Ownership.

– إتاحة حق الحصول على البيانات داخل المنظمة وتحليلها للجميع (دمقرطة البيانات)؛ فلذلك فوائد جمة، منها: زيادة سرعة الاستجابة للتحديات، وقرارات أكثر فعالية، وزيادة الإنتاجية، وتطوير التخطيط الإستراتيجي، والاستفادة من جميع الخبرات في المنظمات، ودعم المبادرات الإبداعية، وتحويل القرارات من ردود أفعال إلى وضع استباقي، وتطوير منتجات بيانات مبتكرة، ودعم الاستدامة والاستمرارية في سوق العمل، وغيرها.

– تمّ الأخذ في الحسبان في هذه الأدوات أفضل الممارسات في أمن المعلومات، والصلاحيات الممنوحة، ومراقبة دفق البيانات، ويمكن فرض رقابة كاملة على ذلك بكلّ سهولة.

– الاقتناع بالقيمة العملية Business Value التي تجلبها البيانات، وأن التطور التقني أنهى الدورة الاعتيادية المكلفة والطويلة لتجميع البيانات وإتاحتها في مستودعات بيانات، ويمكن الآن للجميع من على مكاتبهم جمع البيانات وتخزينها وتحليلها وعرضها، وهو ما يساعدهم على اتخاذ قرارات باستخدام منتجات فعالة وغير مكلفة، ومن دون الحاجة إلى استثمار ضخم في البنية التحتية التقنية.

– اختيار أدوات التحليل المناسبة والمرنة Selfservice data discovery tools  التي تدعم هذا التوجه عنصر أساسي لدعم نجاح هذه المبادرات داخل المنظمات؛ فالأدوات التقليدية Heavyweight tools تحجب تدفق البيانات لوجود حواجز تقنية ودورة حياة نمطية للبيانات تعطل دعم اتخاذ القرار بالشكل المطلوب.

ثقافة البيانات ليس مشروعاً يتم تأطيره بزمن ومخرجات، بل هي طريقة تفكير وعقلية تنمو وتتغير مع الخطط والتنفيذ والواقع، وهي مثل الرحلة التي تتطلب وضع خطط مناسبة تبدأ بإتاحة البيانات، وتنتهي باستخراج القيمة العملية والحقيقية منها، وهو ما يساعد على اتخاذ القرار، وهي رحلة يتخللها كثير من العقبات على جميع المستويات، لكن تطبيق أفضل الممارسات التقنية ببناء خطة شاملة واضحة مقسّمة على مراحل وجزئيات قابلة للتطبيق والتقييم، وتدعيمها بالتدريب والتوعية والأهداف المرحلية، يساعد بشكل كبير على تحقيق ذلك.

المراجع:

(1) Storytelling with Data: A Data Visualization Guide for Business Professionals. Cole Nussbaumer Knaflic, November 2015.

(2) How to Tell a Story with Data. Jim Stikeleather, 2013.

(3) بحسب الكتاب الإحصائي السنوي، هيئة الإحصاء، ٢٠١٤م.

(4) بحسب الكتاب الإحصائي السنوي، هيئة الإحصاء، ٢٠١٥م.

(5) Evil Pies, DataVis Blog.

(6) Inspired by Halifax Crime Map.

(7) https://goo.gl/tcB2yW.

(8) https://goo.gl/1DCDGh.

(9) Lean Analytics: Use Data to Build a Better Startup Faster. Alistair Croll and Benjamin Yoskovitz, 2013.

(10) تعدّ شركة Airbnb من أشهر الشركات السياحية التي تطبق هذه المنهجية، وقد استطاعت فرض نفسها في الأسواق العالمية في زمن قياسي.

(11) Import.io, Extracting Web Data.

(12) Trifacta, Data Wrangling.

(13) QGIS, Open Source GIS.

اضف تعليق

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *