Expected Goals
Numérique

Les Expected Goals, une métrique de plus en plus fiable ?

Photo PA Images / Icon Sport

Lors du match Autriche-France de la ligue des Nations 2022, le commentateur vedette de TF1, Grégoire Margotton, s’emporte au moment d’une occasion de but des Français : « Je ne sais pas si on peut qualifier cela d’expected goal, Bixente, ce qu’on vient de voir. C’est le genre de catégorie statistique qui me hérisse le poil. En tout cas, cela s’appelle une occasion de but en fait ». Pourquoi tant d’animosité vis-à-vis de la data ? Désormais, de plus en plus de clubs de football ont recourt, à des degrés divers, aux statistiques pour gérer à la fois leur budget et leurs performances sportives. C’est le cas par exemple de Liverpool FC, gros utilisateur du Big Data, avec le succès que l’on connait. Note d’analyse de Luc Arrondel et Richard Duhautois, Economistes-Chercheurs au CNRS et au CNAM.

L’utilisation de plus en plus fréquente des datas dans le football : une origine américaine

Dans le film Le Stratège, l’acteur Brad Pitt joue le rôle de Billy Beane directeur général de l’équipe de baseball des Athletics d’Oakland. Confronté à des difficultés financières, il utilise alors, avec l’aide de son adjoint, une approche statistique pour former un groupe compétitif à moindre coût. Ce film est l’adaptation cinématographique de l’ouvrage de Michael Lewis, Moneyball: The Art of Winning an Unfair Game paru en 2003.

Aujourd’hui, quelques clubs de football affichent explicitement la volonté de gérer leur équipe avec l’aide des statistiques et de la data selon les principes du Moneyball. Parmi les plus connus, le FC Midtjylland, club de première division au Danemark, le Brentford FC en Premier League anglaise et, toujours en Angleterre, le Barnsley, club de League one. En France, le récent vainqueur de la Coupe de France, le Toulouse FC, développe également un modèle basé sur la data.

La philosophie générale de ce « modèle » obéit à plusieurs principes de base déterminés par l’exploitation de données. Ainsi, on privilégie les indices de performances – les « expected goal » ou les tirs cadrés par exemple – plutôt que les seules victoires ou défaites – « le classement ment ». On optimise les situations de jeu, lors des coups de pied arrêtés par exemple. Plutôt que dépenser beaucoup dans la formation, on recrute aussi des jeunes joueurs « sous-évalués » – toujours par rapport à des statistiques – et ayant peu de temps de jeu dans leur club d’origine, ce qui permet de les revendre beaucoup plus chers.

L’exemple des « expected goals »

On le sait, l’incertitude est l’une des principales raisons du succès du foot notamment du fait que très peu de buts sont marqués et que les scores sont souvent serrés. Ce n’est pas parce qu’une équipe a gagné le match, qu’elle l’a forcément dominé ou mérité. Pour avoir une vision plus claire de ce qui « aurait dû » se passer, les médias et les analystes se sont dotés d’un indicateur, les « expected goals », généralement abrégés en « xG ». Cette mesure a été inventée au début des années 2010 par un statisticien anglais, Sam Green. On peut la traduire en « buts attendus » ou « buts espérés », si on fait référence aux probabilités. En termes simples, ces « xG » attribuent une probabilité comprise entre 0 et 1 à chaque tir effectué par une équipe dans un match  – 0 indiquant qu’il est impossible que le tir devienne un but et 1 indiquant un but à coup sûr. Ainsi, par exemple, un penalty se verra attribuer un « xG » d’environ 0,75, valeur qui correspond à la probabilité de le convertir en but dans la plupart des championnats européens.

On « additionne » – ou plutôt on agrège selon certaines règles – ensuite ces probabilités pour chaque joueur de façon à estimer le score auquel le match aurait dû aboutir. Par exemple, si on prend la finale de la ligue des champions, Manchester City a gagné 1-0 et les « xG » du match donnent 0,66-1,19, soit un léger avantage à l’Inter que l’on peut arrondir à 1-1 à la fin du temps réglementaire. La probabilité de marquer de Rodri était de 10 % seulement lorsqu’il a ouvert le score et la tête de Lukaku de 42 % lorsqu’elle a rebondi sur le pied d’Emerson !

Puisque l’objectif des « xG » est de prédire la probabilité qu’un tir donné aboutisse à un but, les caractéristiques prédominantes introduites dans les modèles sont la distance, l’angle et le type de tir. Néanmoins, l’un des défauts des modèles qui n’intègrent que ces caractéristiques

Les Expected Goals, une métrique de plus en plus fiable ?
To Top
Send this to a friend