Les datas et le basket

News, History, Stats...

Return to “Around the NBA”

mamath1234

Admin - mamath
User avatar
14561

Les datas et le basket

Post by mamath1234 » 26 September 2017, 09:43

Bonjour à tous,

Comme vous le savez, je travaille dans les bases de données, et j'aimerai tester une techno en montant une petite maquette. Quitte à le faire, autant le faire sur des données qui m'intéresse et j'aurais bien travailler sur la NBA. Ma question concerne les données ? Est-ce que vous savez si il y a moyen de trouver des grosses bases de données sur la NBA ? Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?


Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?

AiR1

Jedi
User avatar
Sydney
7954

Re: Les datas et le basket

Post by AiR1 » 26 September 2017, 11:19

Hello.

Je suppose que tu dois connaître ?
https://hackathon.nba.com/

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 26 September 2017, 11:39

Ben non, je connaissais pas l’initiative, ça devait être sympa, mais les données sont pas publiques. Faut que je creuse un peu.

Sinon j'ai trouvé une API qui permet de travailler ça : https://github.com/kshvmdn/nba.js/blob/ ... pi/DATA.md

SylvesterTemple

Bucks
User avatar
17706

Re: Les datas et le basket

Post by SylvesterTemple » 26 September 2017, 14:33

Désolé Mamath, ce n'st pas moi qui vais pouvoir t'aider...

Mais bon courage !

Image
Giannis Antetokounmpo : "My goal is to win in Milwaukee, bring a Championship to the city... I would never leave for LA." (02/07/2018)

Sam D.

Administrateur
User avatar
33274

Re: Les datas et le basket

Post by Sam D. » 26 September 2017, 16:25

mamath1234 wrote:Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?

Ben en fait BBref &cie ont déjà énormément exploré le filon !

Tiens un truc auquel je pense vu qu'on en parlait l'autre fois (Chris Paul/David West), est-ce que tu pourrais croiser les saisons des meneurs avec les saisons des autres joueurs pour essayer de trouver s'il y a réellement une relation -du moins statistique- entre le niveau de jeu d'un joueur et son meneur ?
Tu vois, je disais que "comme par hasard" les seules bonnes saisons de West correspondaient à celles jouées avec Chris Paul, ça peut être intéressant de voir, à grande échelle, s'il y a un lien établi entre les performances des joueurs (se concentrer sur les intérieurs peut-être) et la "qualité" du meneur avec lequel ils jouent.

Même si ça resterait évidemment purement statistique.
Joel Embiid : "Whatever happens happens. If something happens, something happens."

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 26 September 2017, 17:28

Sam D. wrote:
mamath1234 wrote:Sinon, est-ce qu'il y a des questions que vous vous posez sur les datas en NBA, ou sur des hypothèses que vous voudriez vérifier avec des données ?

Ben en fait BBref &cie ont déjà énormément exploré le filon !
Je sais, même si je trouve qu'en terme de visu le site est aussi riche et vivant qu'un manuscrit sur la tapisserie hongroise du 15ème siècle. Je cherche pas à développer un truc, je cherche à faire des petites maquettes dans une techno qui s’appelle Shiny, alors autant le faire avec des données qui m'amuse.

Je note ta question, et je regarde si les données que je collecte peuvent servir

Garcy22

MVP
User avatar
College Basketball
13732

Re: Les datas et le basket

Post by Garcy22 » 26 September 2017, 17:32

Je rejoins Sam sur le fait que ce qui est tres difficile a quantifier c'est la notion de "rendre ces coequipiers meilleurs" donc un petit modele statistique pourrait etre interessant.

En tout cas, en temps que fan de chiffres, je suivrai ton projet
"Play hard; play smart; play together" - Dean Smith

Chonchito

All Star
User avatar
5583

Re: Les datas et le basket

Post by Chonchito » 26 September 2017, 17:41

mamath1234 wrote:Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?
Pour les stats individuelles, je pense pas que ce soit possible sur des stats libre d'accès. Par contre pour les stats collectives, les game logs avancés de bbref sont parfaits, tu copies/colles le .csv "seulement" 30 fois et tu supprimes les doublons et t'auras largement de quoi t'amuser avec ça. :)

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 26 September 2017, 18:25

Si j'ai trouvé les données individuelles sur 5 ans, via l'API que je cite plus haut.

Après c'est du json, c'est moins accessible que du csv, mais ça à l'avantage d'être structuré

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 28 September 2017, 10:46

Chonchito wrote:
mamath1234 wrote:Pas juste faire des extractions un peu foireuses de basket réference, mais des bases entières (par exemples toutes les stats individuels des matchs de la saison) ?
Pour les stats individuelles, je pense pas que ce soit possible sur des stats libre d'accès. Par contre pour les stats collectives, les game logs avancés de bbref sont parfaits, tu copies/colles le .csv "seulement" 30 fois et tu supprimes les doublons et t'auras largement de quoi t'amuser avec ça. :)

Franchement l'API nba.stats.com c'est super chouette, tu peux récupérer toutes les boxscore depuis 2012, t'a même les Play-by-Play, il y a vraiment moyen de se faire plaisir.

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 28 September 2017, 12:05

Tiens d'ailleurs, j'ai fait un premier test d'intégration de l'API dans l'outils stat que j'utilise (R).

Je me suis dit, tiens on regarde toujours la moyenne de points inscrit par un joueur, mais bon la moyenne c'est un bon indicateur mais qui a, par construction, quelque défauts :
1- Ça cache toute notion de dispersion (Est-ce que le gars score 30 pions tous les soirs, ou 50 un jour et 10 le lendemain ?)
2- La moyenne est fortement impactée par les valeurs extrêmes (Mais c'est pas vraiment le cas en NBA sur une saison régulière)

Je me suis donc amusé à regarder la répartitions des matchs en fonction du nombre de points marqué sur 3 joueurs aux moyennes prochaines (Harden, IT, et Davis). J'ai commencé par ne garder uniquement que les matchs où ils ont joué 30 minutes ou plus et j'ai tracé l'histogramme et la fonction de répartition.

Image

Je trouve que le résultat est assez intéressant car on voit des profils assez différents, IT la valeure sure, jamais en dessous de 20 points sur la saison quand tu le fais jouer 30 minutes, Harden un peu moins fiable mais capable de faire plus souvent des matchs à 35 points ou plus et Davis avec encore plus de matchs à moins de 20 points et par contre encore plus de matchs à 40+

Sam D.

Administrateur
User avatar
33274

Re: Les datas et le basket

Post by Sam D. » 28 September 2017, 12:14

RW ça aurait été sympa pour cette stat :)
Joel Embiid : "Whatever happens happens. If something happens, something happens."

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 28 September 2017, 14:17

Un objectifs dans ces prochains jour, c'est de tester Shiny qui permet de faire des interfaces web avec mn logiciel de stat, je vais essayer de maquetter un petit truc pour comparer cette distribution sur tous les joueurs

galdosh

All Star
User avatar
7854

Re: Les datas et le basket

Post by galdosh » 28 September 2017, 17:03

SHiny utilise R ? J'ai justement croisé un prof en STAPS qui m'expliquait qu'avec R tu pouvais te faire plaisir pour analyser des stats

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 28 September 2017, 17:06

Shiny est un module qui permet de faire des interfaces, c'est ça que je suis en train d'apprendre

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 13 November 2017, 08:57

Bon j'ai pas mal de taf en ce moment mais à partir de Janvier ca devrait un peu s’éclaircir (enfin j'aurais plus deux boulots en parallèle ^^), c'est vraiment sympa les API tu peux acceder automatiquement à quasiment toutes les stats que tu veux.

Je vais essayer de bosser dessus en début d'année prochaine, mais en attendant si d'autres veulent essayer les API n'hésitez pas à me poser des questions.

Sam D.

Administrateur
User avatar
33274

Re: Les datas et le basket

Post by Sam D. » 22 March 2018, 17:07

Alors ? :sifflote:
Joel Embiid : "Whatever happens happens. If something happens, something happens."

mamath1234

Admin - mamath
User avatar
14561

Re: Les datas et le basket

Post by mamath1234 » 22 March 2018, 17:10

je suis sous l'eau au boulot, j'ai vraiment pas le temps de creuser le truc, j'ai plein de projet en sommeil, dont celui la.

Mais franchement c'est cool comme truc, on a accès à toutes les données sous un bon format.

Return to “Around the NBA”