Une analyse de mon top 100Le repêchage est maintenant chose du passé! On peut maintenant s'intéresser aux choses vraiment le fun comme "Est-ce que Canadien a bien repêché?" et "Pourquoi la LNH boude encore les Québécois?"... Ou encore à savoir si mon
top 100 des meilleurs espoirs avait de l'allure. Alors j'ai fait appel à mes amis les mathématiques et j'ai vérifié. Comment? En faisant une analyse de régression linéaire entre mon classement et le consensus des quelques 400 employés de la LNH impliqués dans la sélection des joueurs en fin de semaine. Pourquoi j'ai fait ça? Je veux surtout savoir si mon top 100 reflète ce qui s'est produit en fin de semaine, bref si mes joueurs les mieux classés sont effectivement sortis en premier.
MéthodologieLa méthodologie est bien simple : j'ai mis mon classement sur l'axe des x, le rang auquel chacun de ces joueurs a été sélectionné au repêchage et j'ai vérifier si les deux variables étaient corrélées. J'ai utilisé une régression linéaire parce que c'est plus représentatif de ce que je veux atteindre (et c'est plus facile). Deux petits trucs :
a) Mon classement se limite à 100, celui de la LNH va jusqu'à 210.
b) 18 joueurs de mon top 100 n'ont pas été repêchés (je leur ai donc attribué le rang 211)
GraphiqueChaque point représente un joueur. La ligne rouge représente la corrélation parfaite (si chaque joueur avait été repêché en fonction de mon classement). La ligne bleue (r2 = .250) représente ma courbe de régression. La ligne orange (r2 = .292) représente la courbe de régression sans les joueurs non-repêché (petit truc b). La ligne mauve (r2 = .260) représente la courbe de régression pour les joueurs repêchés dans le top 100 uniquement (représenté ici par la ligne verte) (petit truc a). Notez aussi qu'à l'oeil, les courbes sont plutôt parallèles avec la courbe de la LNH (ce qui est voulu!!), sauf bien sûr la courbe mauve, parce que j'ai beaucoup de données supprimées.AnalyseDans l'ensemble, j'ai réussi à bien analyser les joueurs. Mon indice de corrélation est acceptable (entre .250 et .292 - vous pouvez me faire confiance là-dessus là ^^), ce qui veut dire que de manière générale, plus on avançait dans mon classement, plus le joueur risquait de se faire repêché tard. Le graphique ci-dessus nous permet également d'identifier trois types de joueurs :
a) les normaux : ceux qui sont plus ou moins en ligne avec la courbe (les noirs)
b) les sur-évalués : les joueurs que j'avais classé plus tôt qu'ils ont été repêchés (les rouges)
c) les sous-évalués : les joueurs que j'avais classé plus tôt qu'ils ont été repêchés (les bleus)
Visuellement, on peut identifier que j'ai sur-évalué particulièrement Daniel Audette, Spencer Watson, Jacob Middleton, Julien Nantel et Ondrej Kase. J'ai aussi sous-évalué particulièrement Jake Virtanen, Travis Sanheim, Josh Ho-Sang et Andreas Englund.
DiscussionJe tiens à préciser toutefois qu'il s'agit là d'une comparaison entre moi et le consensus auquel sont arrivés les quelques 400 quelques employés de la LNH en fin de semaine. Est-ce qu'il s'agit là d'une évaluation de mon top 100? Pas vraiment, il s'agit d'avantage d'une évaluation de mes affinités avec les dépisteurs de la LNH. Au bout du compte, seul l'avenir nous dira s'il s'agissait ou non, d'une évaluation adéquate.
Dim 29 Juin - 11:30 par Gab