الإحصاءات: بين التحليل والتضليل (1)
الاثنين / 08 / رمضان / 1440 هـ الاثنين 13 مايو 2019 02:34
ملفي الرشيدي
لعلكم قد سمعتم عن طرفة الإحصائي الذي وضع رأسه في الفرن وقدميه في الثلاجة، ثم قال: «في المتوسط، أشعر أنني على ما يرام». يُقابل ذلك طرفة متداولة حول الإحصائي الذي غرق في مسبح «متوسط عمقه» متر ونصف. لكن المقولة الأكثر شهرة كانت -بشكل مُختلف عليه- لرئيس وزراء بريطاني سابق عندما وصل به الحنق ذروته ليصرخ: «ثمة ثلاثة أنواع من الأكاذيب: أكاذيب عادية وأكاذيب مروعة، وإحصاءات».
من النادر أن تجد من يجادل في أهمية البيانات في عالمنا الرقمي الذي أصبح يُعامل الأرقام والبيانات كأصول مثلها مثل الأصول البشرية والمالية، ونادراً ما تجد من يُقلل من القيمة التي نحصل عليها عند تحليل البيانات بشكل صحيح وموثوق. وقد تكون سمعت عزيزي القارئ عن مقولة: إن الأرقام لا تكذب! وربما مرّ عليك ولكن بشكل أقل مصطلح «إساءة استخدام الإحصاءات» والتي يُقصد به استخدام الإحصاءات لغرض تقديم أنصاف الحقائق أو لعرض معلومات مُضللة أو مُخادِعة للمتلقي في مواضيع حساسة في الاقتصاد أو الصحة أو التعليم سواءً كان ذلك من خلال وسائل الإعلام أو من جهات محددة بعينها. هذه الخدع يمكن أن تؤدي إلى تصورات خاطئة بشكل واسع بشأن الاقتصاد أو الصحة وربما أدت إلى قرارات سيئة أو سياسات رديئة. والحديث هنا ليس عن البيانات التي تم جمعها بشكل خاطئ أو متحيّز بل عن البيانات الصحيحة التي يتم التلاعب بها بطرق متعددة وأساليب متنوعة.
ولعل من نافلة القول إنه حتى عندما تكون الإحصاءات دقيقة تقنياً وفنياً، فإن القراءات الإحصائية المحددة قد تكون مُضللة أو تم تقديمها بشكل مغلوط أو تمت قراءتها بشكل خاطئ. ولعل من أصعب المهام هي تلك التوضيحات التي عادةً تلي مباشرة نشر إحصاءات معينة حول مواضيع اجتماعية أو اقتصادية حساسة أو مثيرة للجدل. لعلنا نتذكر قيام الهيئة العامة للإحصاء في العام الماضي بنشر توضيحات بشأن بياناتها حول معدلات البطالة في المملكة أو عن معدل دخل الأسرة في المملكة (قبل أسابيع) والتي كانت في مُجملها تنص على أن ما تم تداوله جاء وفق قراءات خاطئة. بالطبع فإن هذه الاستدراكات أو التوضيحات ليست حصراً علينا هنا تحدث حتى في الدول الواعية إحصائياً.
على سبيل المثال يعتبر معدل الدخل السنوي- الشهري للأسرة من المؤشرات المهمة من نواحٍ اقتصادية واجتماعية وسياسية لما يترتب على ذلك من دلالات حالية أو سياسات لاحقة. في عام 2018، بلغ «متوسط» دخل الأسرة السنوي في أمريكا حوالى 87 ألف دولار، لكن عند احتساب معدل الدخل السنوي نفسه عن طريق الوسيط (أي القيمة التي تقع في منتصف البيانات بعد فرزها تصاعدياً) بلغ معدل الدخل السنوي للأسرة حوالى 61 ألف دولار. أي أن نصف الأسر في أمريكا يقع دخلهم أقل من 61 ألف دولار في العام، مقارنةً بالمتوسط 86 ألفا الذي لا يتجاوزه إلا ثلث الأسر الأمريكية تقريباً. وهذا مثال واضح على أن المتوسطات يمكن أن تكون مضللة بشكل كبير ومؤشرات لا يؤخذ بها عندما تكون البيانات غير موزعة بشكل طبيعي؛ الدخل السنوي للأسر في هذه الحالة.
في غياب الموثوقية فإن التحليلات الإحصائية والإحصاءات المضللة ببساطة هي سوء استخدام البيانات -سواءً كان بقصدٍ أم غير ذلك- عندما يتلقفها المتلقي أو صاحب المصلحة معتقداً صحتها بالرغم من وجود خطأ لم تتم مُلاحظته أو إحصاءات لم تُستخدم في مكانها المناسب أو تم إدراجها خارج سياقها الصحيح أو تم تقديمها بشكل جزئي.
عموماً يدافع الإحصائيون عن أنفسهم وعن مهنتهم بطرق شتى لعل من أبرزها المقولة التي يرفعها الإحصائي في آخر مرافعاته: «إنه إذا كان من السهل أن تكذب مع الإحصاءات، فإنه من الأسهل أن تكذب بدونها». حمانا الله وإياكم شر الكذب والخداع والإحصاءات المُضللة.
* كاتب سعودي
من النادر أن تجد من يجادل في أهمية البيانات في عالمنا الرقمي الذي أصبح يُعامل الأرقام والبيانات كأصول مثلها مثل الأصول البشرية والمالية، ونادراً ما تجد من يُقلل من القيمة التي نحصل عليها عند تحليل البيانات بشكل صحيح وموثوق. وقد تكون سمعت عزيزي القارئ عن مقولة: إن الأرقام لا تكذب! وربما مرّ عليك ولكن بشكل أقل مصطلح «إساءة استخدام الإحصاءات» والتي يُقصد به استخدام الإحصاءات لغرض تقديم أنصاف الحقائق أو لعرض معلومات مُضللة أو مُخادِعة للمتلقي في مواضيع حساسة في الاقتصاد أو الصحة أو التعليم سواءً كان ذلك من خلال وسائل الإعلام أو من جهات محددة بعينها. هذه الخدع يمكن أن تؤدي إلى تصورات خاطئة بشكل واسع بشأن الاقتصاد أو الصحة وربما أدت إلى قرارات سيئة أو سياسات رديئة. والحديث هنا ليس عن البيانات التي تم جمعها بشكل خاطئ أو متحيّز بل عن البيانات الصحيحة التي يتم التلاعب بها بطرق متعددة وأساليب متنوعة.
ولعل من نافلة القول إنه حتى عندما تكون الإحصاءات دقيقة تقنياً وفنياً، فإن القراءات الإحصائية المحددة قد تكون مُضللة أو تم تقديمها بشكل مغلوط أو تمت قراءتها بشكل خاطئ. ولعل من أصعب المهام هي تلك التوضيحات التي عادةً تلي مباشرة نشر إحصاءات معينة حول مواضيع اجتماعية أو اقتصادية حساسة أو مثيرة للجدل. لعلنا نتذكر قيام الهيئة العامة للإحصاء في العام الماضي بنشر توضيحات بشأن بياناتها حول معدلات البطالة في المملكة أو عن معدل دخل الأسرة في المملكة (قبل أسابيع) والتي كانت في مُجملها تنص على أن ما تم تداوله جاء وفق قراءات خاطئة. بالطبع فإن هذه الاستدراكات أو التوضيحات ليست حصراً علينا هنا تحدث حتى في الدول الواعية إحصائياً.
على سبيل المثال يعتبر معدل الدخل السنوي- الشهري للأسرة من المؤشرات المهمة من نواحٍ اقتصادية واجتماعية وسياسية لما يترتب على ذلك من دلالات حالية أو سياسات لاحقة. في عام 2018، بلغ «متوسط» دخل الأسرة السنوي في أمريكا حوالى 87 ألف دولار، لكن عند احتساب معدل الدخل السنوي نفسه عن طريق الوسيط (أي القيمة التي تقع في منتصف البيانات بعد فرزها تصاعدياً) بلغ معدل الدخل السنوي للأسرة حوالى 61 ألف دولار. أي أن نصف الأسر في أمريكا يقع دخلهم أقل من 61 ألف دولار في العام، مقارنةً بالمتوسط 86 ألفا الذي لا يتجاوزه إلا ثلث الأسر الأمريكية تقريباً. وهذا مثال واضح على أن المتوسطات يمكن أن تكون مضللة بشكل كبير ومؤشرات لا يؤخذ بها عندما تكون البيانات غير موزعة بشكل طبيعي؛ الدخل السنوي للأسر في هذه الحالة.
في غياب الموثوقية فإن التحليلات الإحصائية والإحصاءات المضللة ببساطة هي سوء استخدام البيانات -سواءً كان بقصدٍ أم غير ذلك- عندما يتلقفها المتلقي أو صاحب المصلحة معتقداً صحتها بالرغم من وجود خطأ لم تتم مُلاحظته أو إحصاءات لم تُستخدم في مكانها المناسب أو تم إدراجها خارج سياقها الصحيح أو تم تقديمها بشكل جزئي.
عموماً يدافع الإحصائيون عن أنفسهم وعن مهنتهم بطرق شتى لعل من أبرزها المقولة التي يرفعها الإحصائي في آخر مرافعاته: «إنه إذا كان من السهل أن تكذب مع الإحصاءات، فإنه من الأسهل أن تكذب بدونها». حمانا الله وإياكم شر الكذب والخداع والإحصاءات المُضللة.
* كاتب سعودي