Ir al contenido

Documat


Informative prior distributions for a binomial model to predict professional tennis results

  • Autores: Pierre Colin, Aurélien Bechler
  • Localización: Journal de la Société Française de Statistique & revue de statistique appliquée, ISSN 0037-914X, Vol. 156, Nº. 2, 2015 (Ejemplar dedicado a: Sport et Statistique), págs. 25-37
  • Idioma: inglés
  • Títulos paralelos:
    • Prédiction des résultats de matchs de tennis professionnel par un modèle binomial avec des lois a priori informatives
  • Enlaces
  • Resumen
    • français

      Le tennis, comme de nombreux sports, a pour caractéristiques d’être à la fois simple dans le type de résultat obtenu (victoire de l’un des deux joueurs) et complexe dans les facteurs explicatifs de ce résultat. La collecte des données liées aux matchs de tennis professionnel ne cessant d’augmenter, l’information disponible est de plus en plus précise. Nous avons étudié les propriétés prédictives d’un modèle binomial représentant la victoire d’un joueur sur un autre. Le cadre d’inférence bayésien permet d’utiliser un prior informatif sur la probabilité de victoire (une loi Bêta) afin d’inclure cette information collectée. Nous avons comparé sur l’année 2013 du circuit ATP (et ajusté sur les années 2011-2012) trois méthodes de choix de prior. Les deux premières sont basées sur des modèles à variables latentes (Elo et Bradley-Terry). La troisième est une méthode de simulation de chaque point joué pendant un match reposant sur les statistiques MatchFacts de l’ATP. Chaque méthode est séparée en deux étapes : déterminer la moyenne de la loi a priori sur la base d’information collectée, puis sa variance sur la base des propriétés prédictives du modèle. La deuxième partie de cet article propose plusieurs utilisations possibles de ces méthodes, que cela soit pour la prédiction de matchs, de tournoi ou pour proposer un nouveau système de classement des joueurs.

    • English

      Tennis is a sport, as many others, that appears to be quite simple in the type of results (victory of one of the two players) but rather quite complex in factors that leads to this binary outcome. The perpetual evolution and increase of the way to collect data leads to more and more accurate available information about professional tennis matches. We studied the predictive properties of the binomial model representing the victory of one player against the other. Bayesian framework enables the updating of an informative prior distribution on the probability of winning (Beta distribution) by the collected information. After model calibration on the years 2011-2012, we test on the result 2013 of the ATP tour three methodologies for the choice of prior. The two firsts are based on latent variable models (Elo and Bradley-Terry). The third one is a point-by-point game simulation method based on the MatchFact statistics of the ATP. Each method is separated in two steps: specify the mean of the a priori distribution based on gathered data, and then its variance according to predictive characteristics. The second part of this article deals with possible uses of these methods for match result predictions, for whole tournament simulations or to propose a new ranking system for professional tennis players.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno