Les datas et le basket
-
mamath1234
- 14561
Les datas et le basket
Bonjour à tous,
Comme vous le savez, je travaille dans les bases de données, et j'aimerai tester une techno en montant une petite maquette. Quitte à le faire, autant le faire sur des données qui m'intéresse et j'aurais bien travailler sur la NBA. Ma question concerne les données ? Est-ce que vous savez si il y a moyen de trouver des grosses bases de données sur la NBA ? Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?
Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?
Comme vous le savez, je travaille dans les bases de données, et j'aimerai tester une techno en montant une petite maquette. Quitte à le faire, autant le faire sur des données qui m'intéresse et j'aurais bien travailler sur la NBA. Ma question concerne les données ? Est-ce que vous savez si il y a moyen de trouver des grosses bases de données sur la NBA ? Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?
Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?
-
AiR1
- Sydney
- 7954
-
mamath1234
- 14561
Re: Les datas et le basket
Ben non, je connaissais pas l’initiative, ça devait être sympa, mais les données sont pas publiques. Faut que je creuse un peu.
Sinon j'ai trouvé une API qui permet de travailler ça : https://github.com/kshvmdn/nba.js/blob/ ... pi/DATA.md
Sinon j'ai trouvé une API qui permet de travailler ça : https://github.com/kshvmdn/nba.js/blob/ ... pi/DATA.md
-
SylvesterTemple
- 17706
Re: Les datas et le basket
Désolé Mamath, ce n'st pas moi qui vais pouvoir t'aider...
Mais bon courage !
Mais bon courage !
Giannis Antetokounmpo : "My goal is to win in Milwaukee, bring a Championship to the city... I would never leave for LA." (02/07/2018)
-
Sam D.
- 33274
Re: Les datas et le basket
mamath1234 wrote:Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?
Ben en fait BBref &cie ont déjà énormément exploré le filon !
Tiens un truc auquel je pense vu qu'on en parlait l'autre fois (Chris Paul/David West), est-ce que tu pourrais croiser les saisons des meneurs avec les saisons des autres joueurs pour essayer de trouver s'il y a réellement une relation -du moins statistique- entre le niveau de jeu d'un joueur et son meneur ?
Tu vois, je disais que "comme par hasard" les seules bonnes saisons de West correspondaient à celles jouées avec Chris Paul, ça peut être intéressant de voir, à grande échelle, s'il y a un lien établi entre les performances des joueurs (se concentrer sur les intérieurs peut-être) et la "qualité" du meneur avec lequel ils jouent.
Même si ça resterait évidemment purement statistique.
Joel Embiid : "Whatever happens happens. If something happens, something happens."
-
mamath1234
- 14561
Re: Les datas et le basket
Je sais, même si je trouve qu'en terme de visu le site est aussi riche et vivant qu'un manuscrit sur la tapisserie hongroise du 15ème siècle. Je cherche pas à développer un truc, je cherche à faire des petites maquettes dans une techno qui s’appelle Shiny, alors autant le faire avec des données qui m'amuse.Sam D. wrote:mamath1234 wrote:Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?
Ben en fait BBref &cie ont déjà énormément exploré le filon !
Je note ta question, et je regarde si les données que je collecte peuvent servir
-
Garcy22
- College Basketball
- 13742
Re: Les datas et le basket
Je rejoins Sam sur le fait que ce qui est tres difficile a quantifier c'est la notion de "rendre ces coequipiers meilleurs" donc un petit modele statistique pourrait etre interessant.
En tout cas, en temps que fan de chiffres, je suivrai ton projet
En tout cas, en temps que fan de chiffres, je suivrai ton projet
"Play hard; play smart; play together" - Dean Smith
-
Chonchito
- 5583
Re: Les datas et le basket
Pour les stats individuelles, je pense pas que ce soit possible sur des stats libre d'accès. Par contre pour les stats collectives, les game logs avancés de bbref sont parfaits, tu copies/colles le .csv "seulement" 30 fois et tu supprimes les doublons et t'auras largement de quoi t'amuser avec ça.mamath1234 wrote:Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?
-
mamath1234
- 14561
Re: Les datas et le basket
Si j'ai trouvé les données individuelles sur 5 ans, via l'API que je cite plus haut.
Après c'est du json, c'est moins accessible que du csv, mais ça à l'avantage d'être structuré
Après c'est du json, c'est moins accessible que du csv, mais ça à l'avantage d'être structuré
-
mamath1234
- 14561
Re: Les datas et le basket
Chonchito wrote:Pour les stats individuelles, je pense pas que ce soit possible sur des stats libre d'accès. Par contre pour les stats collectives, les game logs avancés de bbref sont parfaits, tu copies/colles le .csv "seulement" 30 fois et tu supprimes les doublons et t'auras largement de quoi t'amuser avec ça.mamath1234 wrote:Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?
Franchement l'API nba.stats.com c'est super chouette, tu peux récupérer toutes les boxscore depuis 2012, t'a même les Play-by-Play, il y a vraiment moyen de se faire plaisir.
-
mamath1234
- 14561
Re: Les datas et le basket
Tiens d'ailleurs, j'ai fait un premier test d'intégration de l'API dans l'outils stat que j'utilise (R).
Je me suis dit, tiens on regarde toujours la moyenne de points inscrit par un joueur, mais bon la moyenne c'est un bon indicateur mais qui a, par construction, quelque défauts :
1- Ça cache toute notion de dispersion (Est-ce que le gars score 30 pions tous les soirs, ou 50 un jour et 10 le lendemain ?)
2- La moyenne est fortement impactée par les valeurs extrêmes (Mais c'est pas vraiment le cas en NBA sur une saison régulière)
Je me suis donc amusé à regarder la répartitions des matchs en fonction du nombre de points marqué sur 3 joueurs aux moyennes prochaines (Harden, IT, et Davis). J'ai commencé par ne garder uniquement que les matchs où ils ont joué 30 minutes ou plus et j'ai tracé l'histogramme et la fonction de répartition.
Je trouve que le résultat est assez intéressant car on voit des profils assez différents, IT la valeure sure, jamais en dessous de 20 points sur la saison quand tu le fais jouer 30 minutes, Harden un peu moins fiable mais capable de faire plus souvent des matchs à 35 points ou plus et Davis avec encore plus de matchs à moins de 20 points et par contre encore plus de matchs à 40+
Je me suis dit, tiens on regarde toujours la moyenne de points inscrit par un joueur, mais bon la moyenne c'est un bon indicateur mais qui a, par construction, quelque défauts :
1- Ça cache toute notion de dispersion (Est-ce que le gars score 30 pions tous les soirs, ou 50 un jour et 10 le lendemain ?)
2- La moyenne est fortement impactée par les valeurs extrêmes (Mais c'est pas vraiment le cas en NBA sur une saison régulière)
Je me suis donc amusé à regarder la répartitions des matchs en fonction du nombre de points marqué sur 3 joueurs aux moyennes prochaines (Harden, IT, et Davis). J'ai commencé par ne garder uniquement que les matchs où ils ont joué 30 minutes ou plus et j'ai tracé l'histogramme et la fonction de répartition.
Je trouve que le résultat est assez intéressant car on voit des profils assez différents, IT la valeure sure, jamais en dessous de 20 points sur la saison quand tu le fais jouer 30 minutes, Harden un peu moins fiable mais capable de faire plus souvent des matchs à 35 points ou plus et Davis avec encore plus de matchs à moins de 20 points et par contre encore plus de matchs à 40+
-
Sam D.
- 33274
Re: Les datas et le basket
RW ça aurait été sympa pour cette stat
Joel Embiid : "Whatever happens happens. If something happens, something happens."
-
mamath1234
- 14561
Re: Les datas et le basket
Un objectifs dans ces prochains jour, c'est de tester Shiny qui permet de faire des interfaces web avec mn logiciel de stat, je vais essayer de maquetter un petit truc pour comparer cette distribution sur tous les joueurs
-
galdosh
- 7854
Re: Les datas et le basket
SHiny utilise R ? J'ai justement croisé un prof en STAPS qui m'expliquait qu'avec R tu pouvais te faire plaisir pour analyser des stats
-
mamath1234
- 14561
Re: Les datas et le basket
Shiny est un module qui permet de faire des interfaces, c'est ça que je suis en train d'apprendre
-
mamath1234
- 14561
Re: Les datas et le basket
Bon j'ai pas mal de taf en ce moment mais à partir de Janvier ca devrait un peu s’éclaircir (enfin j'aurais plus deux boulots en parallèle ^^), c'est vraiment sympa les API tu peux acceder automatiquement à quasiment toutes les stats que tu veux.
Je vais essayer de bosser dessus en début d'année prochaine, mais en attendant si d'autres veulent essayer les API n'hésitez pas à me poser des questions.
Je vais essayer de bosser dessus en début d'année prochaine, mais en attendant si d'autres veulent essayer les API n'hésitez pas à me poser des questions.
-
Sam D.
- 33274
Re: Les datas et le basket
Alors ?
Joel Embiid : "Whatever happens happens. If something happens, something happens."
-
mamath1234
- 14561
Re: Les datas et le basket
je suis sous l'eau au boulot, j'ai vraiment pas le temps de creuser le truc, j'ai plein de projet en sommeil, dont celui la.
Mais franchement c'est cool comme truc, on a accès à toutes les données sous un bon format.
Mais franchement c'est cool comme truc, on a accès à toutes les données sous un bon format.