كيف عشت طيلة عمرك تخطئ بقراءة إحصائيات المباراة؟
إن كنت تسأل، فالإجابة نعم، التصريح السابق يتحدث عن كرة القدم، لكنها بالتأكيد غير تلك المتاحة في عالمنا العربي. لأننا باختصار، لا نحبذ مثل هذا التطور الرقمي، إما لكوننا عالمًا ثالثًا لا يحتاجه، أو لأنه قد يطيح بالديناصورات المسئولة عن إدارة اللعبة.
أو لأن صديقي يستخدم هذه الأرقام لتزييف الواقع الذي رأيته بأم عيني. لذا، سنحاول منحك الأفضلية في ذلك النقاش بتصحيح قراءة بعض الإحصائيات، لكن دعنا أولًا نتعرف على أهمية التطور الرقمي بكرة القدم، ثم سنشرح لك أين تكمن الخدعة؟
اسأل خبيرًا
تواصلت «إضاءات» مع «عمر شودري» مدير قسم الذكاء الاصطناعي في كرة القدم «Football Intelligence» بشركة «21st Club» للتحليل والإحصائيات، وبسؤاله عن تأثير استخدام البيانات داخل وخارج الملعب، أخبرنا أن البيانات تساعد على إضافة الموضوعية إلى القرارات، لأن كرة القدم لعبة عاطفية، تتلاعب بمشاعرنا بدرجة كبيرة، لذا بات ضروريًّا امتلاك دليل إضافي يزيد من فاعلية القرار، على الصعيدين الفني والإداري.
وتعقيبًا على ذلك، يبدو الأمر أكثر منطقية، عندما ننظر إلى حجم الاستثمارات المتزايد، والذي زاد بالتبعية من تكلفة القرارات، لكن هل يعني ذلك أن كل من يمتلك البيانات، سيتخذ القرارات الصحيحة؟
وهذا تحديدًا ما يصنع الفارق؛ لأن امتلاك أعقد البيانات قد لا ينعكس بالضرورة على القرارات، ولنا في الفارق بين إدارتي ليفربول وبرشلونة في الفترة بين 2016 و2020 خير دليل، حيث قامت الأولى بتشكيل فريق بطل من صفقات متوسطة، أما الثانية فأهدرت الأموال على صفقات مكلفة غير مناسبة، على رأسها كوتيتنو.
وبالانتقال من الشق الإداري إلى الفني، فإن الأمر لن يقل تعقيدًا، ولمحاولة تبسيطه لك، تواصلنا مع «محمود سليم» محلل أداء نادي الوحدة السعودي ليخبرنا بالتالي:
صحح إحصائياتك
بهذه الشروحات البسيطة نظن الآن أنك قد أدركت جزءًا من أهمية الإحصائيات، لكن كمشجع ستسأل نفسك، هل يجب أن أدرك كل هذه التفاصيل؟ بالطبع لا، لكن كما أوضح لنا «عمر شودري»، فإن استخدام المشجعين للإحصائيات ومحاولة فهمها يزيد يومًا بعد يوم، وبمرور الوقت ستصبح جزءًا من نقاشات الجماهير، ولأن الوقت حان، إليك 6 إحصائيات تسيء قراءتها، قدمتها قناة «Tifo Football»:
1- الاستحواذ للحكم على أفضلية الفريق:
كما فاز ليستر سيتي بالبريميرليج بمتوسط استحواذ بلغ 42.6%، فاز مانشستر سيتي باللقب موسم 2018/2019 بمتوسط 67.7%. وتأكيدًا على ذلك، يصف جوارديولا الاستحواذ بأنه وسيلة لا غاية. والأقرب أن الاستحواذ يعبر عن أسلوب لعب الفريق، أما لتحديد الأفضلية فإحصائية الأهداف المتوقعة هي الأفضل.
2- دقة التمرير للحكم على جودة اللاعب:
وفقًا لأسلوب لعب الفريق، وانتشار لاعبيه، يمكن للاعب أن يجد عديد الخيارات المتاحة للتمرير كما الحال في مانشستر سيتي، وعليه ستزيد دقة تمريره. أما في فريق يميل للعب كرات طويلة مثل بيرنلي، فسينخفض الرقم. لذا فإن دقة التمرير بشكل مجرد لا تكفي للحكم على الجودة.
3- عدد الكيلومترات المقطوعة للحكم على المجهود المبذول:
زيادة المجهود يقابلها منح الأفضلية لأحد الفريقين، لكن كرة القدم ليست سباقًا للعدو، والأصح، أن المسافة والسرعة التي يقطعها اللاعبون ترتبط بأسلوب لعب فريقهم والتحركات المطلوب تنفيذها، إلى جانب أسلوب لعب الخصم، دفاعًا وهجومًا. مع الأخذ في الاعتبار بعض اللاعبين المؤثرين من وضعية المشي، مثل ميسي.
4- العرقلة، والكرات المقطوعة للحكم على جودة اللاعب دفاعيًّا:
هنا لدينا مشكلتان، الأولى أن الفريق يدافع كوحدة واحدة وإذا قام الجميع بتغطية المساحات المطلوبة، فإن إحصائية الكرات المقطوعة لن تتوزع عليهم بالتساوي. الثانية هي سيطرة الفريق على الاستحواذ أغلب الوقت، وبالتالي لن يظهر لاعبوه كثيرًا بتلك الإحصائيات.
وبالتالي يمكن أن نعتمد هذه الإحصائية لتحديد الطريقة التي يدافع بها اللاعب (إيجابي أو سلبي) وليست الجودة، مثل: فان دايك (0.76 عرقلة لكل مباراة).
5- نسبة العرقلات الناجحة للحكم على قدرة اللاعب على العرقلة:
ما لا تعلمه أن العرقلة الناجحة إحصائيًّا هي التي تعيد الاستحواذ لفريقك، وإذا قام اللاعب بإبعاد الكرة لتتحول إلى رمية تماس، فإنها من سوء حظه تحتسب عرقلة فاشلة.
فنسبة العرقلات الناجحة = العرقلات الناجحة/ ( العرقلات الناجحة+الفاشلة )
أما إذا أردت قياس براعة اللاعب في القيام بالعرقلة، فعليك أن تجعل الرقم أكثر شمولًا بقسمة عدد العرقلات الناجحة -سواء انتهت بالاستحواذ أو رمية تماس- على (عدد العرقلات الكلي + المواجهات غير الناجحة + المخالفات الناتجة عن عرقلة). ولتقريب الأمر إلى ذهنك، طريقة الحساب الأولى تضع «أرون وان بيساكا» في المركز 11، والثانية تضعه في المركز الأول.
6- نسبة الإنقاذ لتقييم حراس المرمى:
تعتمد النسبة حسابيًّا على مقارنة عدد التصديات إلى إجمالي التسديدات المستقبَلة، وبالتالي لا يوجد أي اعتبار لأماكن التسديد، نوع التسديدة، وجودتها، لتتحول إلى إحصائية عمياء. لكن بحساب الأهداف المتوقعة على المرمى «Expected Goals on target» مقارنةً بعدد الأهداف التي استقبلها، تصبح الإحصائية أكثر دقة.
أين الخدعة؟
نأتي أخيرًا للسؤال الأهم، بعد تعديل قراءتنا للإحصائيات السابقة، هل ستتوحد آراؤنا؟ للأسف لا، لسببين: الأول، لأن الإحصائيات بكل تفاصيلها لا يمكن أن تقودنا إلى نهاية واحدة، وإن كانت تفعل، لكان محلل أداء بليفربول مساويًا لمحلل الأداء في نادٍ أقل شأنًا.
أما السبب الثاني فهو الذي سيقودك في النقاش القادم للمشاجرة مع صديقك، وهو يتعلق بـ «مفارقة سيمبسون» «SIMPSON’s Paradox». سأشرح لك بمثال، إن استدعت حالة مريض لدخوله مستشفى، وكان عليه الاختيار بين المستشفى (أ)، والمستشفى (ب).
وعند سؤالك، علمت أنه من آخر 1000 مريض، نجا 900 في (أ)، و800 في (ب)، وبالتالي سيبدو خيار (أ) منطقيًّا. لكن إذا قمنا بدراسة تفاصيل المرضى لمعرفة كم منهم وصل في حالة متأخرة، فسنجد أن (أ) استقبلت 100 مريض في حالة متأخرة، أنقذت 30 منهم فقط، أما (ب) فاستقبلت 400 في حالة متأخرة، تم إنقاذ 210 منهم. لذا أصبح مستشفى (ب) أفضل للحالات المتأخرة بنسبة نجاة 52.5%، وبشكل أغرب فإن (ب) أفضل أيضًا للحالات غير المتأخرة بنسبة نجاة 98%.
ذلك ما يسمى بـ «مفارقة سيمبسون»، حيث يكون لدينا نفس المجموعة من البيانات، ولكن تظهر نتيجتان متعاكستان، اعتمادًا على طريقة تقسيمها. يحدث ذلك غالبًا عندما تخفي البيانات بعض المتغيرات، نسميها بالمتغيرات المندسة، والتي يمكنها تغيير النتيجة.
وبنفس الطريقة في كرة القدم، يمكن عرض الإحصائيات، وإخفاء بعض العوامل المندسة بقصد أو بدون لدعم وجهة نظرك. لكن الجيد أن تطور الإحصائيات يحاول التقليل تلك العوامل، حيث يوجد لكل إحصائية نسخة مطورة منها.
يقابل الأهداف، الأهداف المتوقعة لقياس جودة الفرص، وصناعة الأهداف يقابلها الأسيستات المتوقعة لقياس جودة الأسيست، وعدد ودقة التمريرات يقابلها إحصائية Packing & impect لتقييم التمريرة بعدد الخطوط التي تكسرها، وهكذا وهكذا، لكن في الأخير لو كان ذلك كافيًا لإقناع أحد، فلن يكون الجمهور.