By : Sysyphus - Pommard | Tuesday, February 5, 2019 at 6:27 AM
Default
jmguiche
jmguiche
mais au final, que souhaites tu obtenir ? un classement idéal à partir de données qui s'auto influence (effet boulle de neige), données par des populations ayant, en moyenne, des gouts orientés ? Chacun des votant ne votant en plus que d'après une vision très partielle ? C'est peine perdue.

Et ce classement idéal, il servira à quoi ?
Le premier jeu de ton classement il sera soit complexe soit simple, soit ameritrash, soit allemand soit comm (ou autre). Et la personne qui achète ce jeu "parce qu'il est premier de la liste" a de fortes chances de se tromper.

Je cherche un jeu complexe ? Je ne connais que BGG ? Je regarde sur BGG les premier jeux complexe ! (et je fais une connerie car c'est pour un cadeau et mon pote, ce jeu que je ne connais pas, il l'a déjà).

Je cherche un jeu simple ? Je ne connais que BGG,? Je cherche sur BGG les premiers jeux simples....


Je ne comprend pas trop le concept de jeu simple ou jeu complexe ? Avant de faire n'importe quoi, je devrais me faire conseiller plutot que de suivre un tas d'avis aux quels je ne comprend rien.
My top
No board game found
MasterMindM
MasterMindM
Blue dit :

Qu'on on appelle ça un biais ou une corrélation je rappelle le 1er post : le fait statistiquement avéré que les jeux les plus complexes sont en moyenne mieux notés.
 

J'insiste, mais cette phrase est une erreur. Le classement dit : les jeux les mieux notés sont complexes, pas l'inverse.

 

Oui et non.

Si on suppose(1) 
 - que la complexité n'a aucun impact sur la qualité d'un jeu
 - que les gens notent la qualité(2) d'un jeu indépendamment de la complexité

alors la moyenne des notes des jeux complexes devrait être sensiblement égale à la moyenne des notes des jeux simples. Le constat ici est que le classement semble montrer que ce n'est pas le cas(3). On aurait donc bien une sous population 'jeu complexe' mieux notée que la sous population 'jeu simple'.

On est donc face à ce que plusieurs ont appelé un "biais", une "erreur statistique", bref un résultat 'pratique' qui ne correspond pas au résultat 'théorique' attendu.

A partir de ce constat, que peut-on en déduire ? Je vois personnellement plusieurs possibilités :
 - les faits sont 'faux' : problème de calcul des notes sur BGG, mauvaise interprétation des chiffres de notre part, ... --> remise en question des résultats pratiques
 - les hypothèses sont 'fausse' : les jeux complexes sont peu être meilleurs car ils demandent plus de travail, de tests d'équilibrage, d'autres critères corrélés à la complexité interviennent dans l'attribution des notes, ... --> remise en question des hypothèses.

Pour ma part, j'aurais tendance à remettre en question les hypothèses, en particulier celle qui dit que : "les gens notent la qualité d'un jeu indépendamment de la complexité", et j'en conclurais donc que les joueurs notant sur BGG donneraient des meilleures notes en moyenne pour les jeux complexes (d'autres pourraient en conclure que les jeux complexes sont simplement meilleurs, et d'autres encore pourraient voir d'autres hypothèses que les miennes).

Après encore une fois, ça ne veut PAS dire que le classement corrigé est meilleure. Mais si le but est faire tendre un classement vers le ressenti du visiteur lambda(4) du site de BGG(5), ça me semble cohérent de pondérer "l'effet bonus" des jeux complexes.




(1) : je ne prétends pas que c'est le cas.
(2) : la qualité sera forcément ressentie donc relative, mais bon...
(3) : une forte présence dans le top 100 n'est peut être pas un vrai calcul de moyenne, mais bon...
(4) : il faudra vraiment qu'on nous présente ce fameux joueur lambda un jour :)
(5) : qui connait vraiment le but de BGG dans l'existence ? Pas moi...

My top
Alfa
Alfa
MasterMindM dit :
Blue dit :

Qu'on on appelle ça un biais ou une corrélation je rappelle le 1er post : le fait statistiquement avéré que les jeux les plus complexes sont en moyenne mieux notés.
 

J'insiste, mais cette phrase est une erreur. Le classement dit : les jeux les mieux notés sont complexes, pas l'inverse.

 

Oui et non.

Si on suppose(1) 
 - que la complexité n'a aucun impact sur la qualité d'un jeu
 - que les gens notent la qualité(2) d'un jeu indépendamment de la complexité

alors la moyenne des notes des jeux complexes devrait être sensiblement égale à la moyenne des notes des jeux simples. Le constat ici est que le classement semble montrer que ce n'est pas le cas(3). On aurait donc bien une sous population 'jeu complexe' mieux notée que la sous population 'jeu simple'.

On est donc face à ce que plusieurs ont appelé un "biais", une "erreur statistique", bref un résultat 'pratique' qui ne correspond pas au résultat 'théorique' attendu.

A partir de ce constat, que peut-on en déduire ? Je vois personnellement plusieurs possibilités :
 - les faits sont 'faux' : problème de calcul des notes sur BGG, mauvaise interprétation des chiffres de notre part, ... --> remise en question des résultats pratiques
 - les hypothèses sont 'fausse' : les jeux complexes sont peu être meilleurs car ils demandent plus de travail, de tests d'équilibrage, d'autres critères corrélés à la complexité interviennent dans l'attribution des notes, ... --> remise en question des hypothèses.

Pour ma part, j'aurais tendance à remettre en question les hypothèses, en particulier celle qui dit que : "les gens notent la qualité d'un jeu indépendamment de la complexité", et j'en conclurais donc que les joueurs notant sur BGG donneraient des meilleures notes en moyenne pour les jeux complexes (d'autres pourraient en conclure que les jeux complexes sont simplement meilleurs, et d'autres encore pourraient voir d'autres hypothèses que les miennes).

Après encore une fois, ça ne veut PAS dire que le classement corrigé est meilleure. Mais si le but est faire tendre un classement vers le ressenti du visiteur lambda(4) du site de BGG(5), ça me semble cohérent de pondérer "l'effet bonus" des jeux complexes.




(1) : je ne prétends pas que c'est le cas.
(2) : la qualité sera forcément ressentie donc relative, mais bon...
(3) : une forte présence dans le top 100 n'est peut être pas un vrai calcul de moyenne, mais bon...
(4) : il faudra vraiment qu'on nous présente ce fameux joueur lambda un jour :)
(5) : qui connait vraiment le but de BGG dans l'existence ? Pas moi...

Merci pour cet exposé très clair. J’ajoute que l’article cite en début de sujet ne se concentre pas uniquement sur le top 100 mais sur lensemble de la base de données bgg. 

jmguiche
jmguiche
Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexes)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.


L'auteur du papier initial a pris des données et les a bricolées sans se poser la véritable question : "quelle est la signification de ce que je fais et obtient ?".
Tout ce qu'il a démontré, et c'est interessant, c'est, globalement, sur BGG, on préfère les jeux complexe.
Ensuite, ce qu'il a fait, c'est du bidouillage qui permet d'obtenir un autre classement dont il ne donne pas la définition.
Et cette définition est : "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexes)".
Y'a pas de quoi s'extasier à mon avis, et ça sert à rien.

 
My top
No board game found
Alfa
Alfa
jmguiche dit :Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexe)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.

As tu bien lu le premier post et l’article associé ? La corrélation est avérée. 
Une proposition de correction est faite pour supprimer la corrélation poids/note. 
On se retrouve avc un classements qui ne comporte plus de corrélation avec la complexité du jeu. 
Si tu penses que les jeux complexes sont les meilleurs, ça ne te plaira pas. Si tu penses comme moi que les 2 paramètres sont théoriquement  indépendants, le classement corrigé est meilleur car il ne présente plus cette aberration.  

jmguiche
jmguiche
Alfa dit :
jmguiche dit :Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexe)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.

As tu bien lu le premier post et l’article associé ? La corrélation est avérée. 
Une proposition de correction est faite pour supprimer la corrélation poids/note. 
On se retrouve avc un classements qui ne comporte plus de corrélation avec la complexité du jeu. 
Si tu penses que les jeux complexes sont les meilleurs, ça ne te plaira pas. Si tu penses comme moi que les 2 paramètres sont indépendants, le classement corrigé est meilleur car il ne présente plus cette aberration.  

J'ai lu le papier.
Ce n'est pas une aberration, c'est une information, sur BGG, on préfère ce qui est complexe (et, pour être exhaustif je devrais ajouter "ou alors ce qui est complexe mérite "objectivement" de meilleures notes".

Quelle est la signification du retrait de la corrélation ? La corrélation existe, c'est un fait statistique. On l'enlève et on génère un nouveau classement ? Et bien ce classement ne peut être interprété que comme : "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexes)". Ce que j'écrit ci dessus dans un précédent post.
Et ce classement ne signifie vraiment rien ! C'est de la mauvaise utilisation de données et de méthodes statistiques qui donne un résultat encore moins significatifs que les données de départ.

Ce n'est pas parce que je fais des moyennes pondérées ou des rotations de nuage de points que ce que je fais a du sens.
L'habillage mathématique avec des calculs n'est pas un gage de sens, pas plus en statistiques qu'en astrologie ! Les outils statistiques doivent s'appliquer en connaissance de cause, en maitrisant le sens de ses outils et la compréhension de ses données.
Cela devrait être répété toute les semaines aux étudiants qui font des Stats !
Et c’est justement parce que j’aime aussi bien des jeux complexes que les jeux simples que je me rend compte que bricoler des données pour savoir si codename est meilleur que pandémie legacy ou pas est totalement dénué de sens.
 

My top
No board game found
Alfa
Alfa
« sur BGG, on préfère ce qui est complexe (et, pour être exhaustif je devrais ajouter "ou alors ce qui est complexe mérite "objectivement" de meilleures notes".) »

Je ne pense pas : perso , Je note sur bgg et je ne pense pas objectivement qu’un jeu complexe mérite une meilleure note ni qu’un bon jeu doivent être complexe. Si j’ai noté comme cela, je dois être victime d’une erreur de jugement. Et je ne dois pas être le seul...
jmguiche
jmguiche
Alfa dit :« sur BGG, on préfère ce qui est complexe (et, pour être exhaustif je devrais ajouter "ou alors ce qui est complexe mérite "objectivement" de meilleures notes".) »

Je ne pense pas : perso , Je note sur bgg et je ne pense pas objectivement qu’un jeu complexe mérite une meilleure note ni qu’un bon jeu doivent être complexe. Si j’ai noté comme cela, je dois être victime d’une erreur de jugement. Et je ne dois pas être le seul...

Tu as bien raison et tu interprète mal ce que je dis. Ce que cela signifie c’est qu’en toute subjectivité,  les gens qui notent sur bgg, globalement preferent  les jeux complexe. Ce n’est pas parce que c’est complexe qu’ils note mieux, c’est parce qu’ils y prennent plus de plaisir quand c’est complexe.
et c’est bien pour cela que le bricolage n’a pas de sens ! 

il aurait du sens si en effet les gens notaient mieux parce que c’est complexe et saquaient les jeux simple. La il y aurait un biais à rattraper. 
ce n’est pas le cas. Ils aiment mieux. Ce n’est pas un biais c’est une information. 

Un bricolage de calcul qui permet de gommer une info ne sert qu’a perdre de l’info, pas à donner du sens.

My top
No board game found
jmguiche
jmguiche
Le bon bricolage n’est pas de pondérer les notes.
pour avoir un palmarès qui représente un goût moyen de la population, ce n’est pas en bricolant les notes, c’est en jouant sur la représentativité des populations.
C’est une technique maîtrisée par les institut de sondages.

on analyse la population de votant, on compare avec la population globale en supposant qu’on a la bonne méthode de partition de la population et on pondère les votes en fonction des populations. Ça a du sens mais c’est infaisable avec un classement bgg. On n’a pas la bonne partition de la population pour ce sujet (les jeux de société) et on n’a pas les données sur les votants.


Mais je me demande quand même a quoi ça va servir de savoir que le jeu préféré des français c'est 1 le monopoly, 2 la belote.
 
My top
No board game found
Acathla
Acathla
Un classement c'est bourré de biais...
un de plus, un de moins...

je me souviens d'un sujet sur le biais 
"Récent mieux noté que vieux" (sans etre forcement mieux...) sur bgg


retour dans le passé 

ici

la

Une pelle




 
Default
jmguiche
jmguiche
Acathla dit :Un classement c'est bourré de biais...
un de plus, un de moins...

je me souviens d'un sujet sur le biais 
"Récent mieux noté que vieux" (sans etre forcement mieux...) sur bgg


retour dans le passé 

ici

la

Une pelle




 

Oui. D'ailleurs tout les classements qui ne reflètent pas mon avis sont nuls et il faut faire plein de manip en phyton dessus pour les rendre justes.

My top
No board game found
Acathla
Acathla
jmguiche dit :
Acathla dit :Un classement c'est bourré de biais...
un de plus, un de moins...

je me souviens d'un sujet sur le biais 
"Récent mieux noté que vieux" (sans etre forcement mieux...) sur bgg


retour dans le passé 

ici

la

Une pelle




 

Oui. D'ailleurs tout les classements qui ne reflètent pas mon avis son nul et il faut faire plein de manip en phyton dessus pour les rendre justes.

L'avis d'un joueur n'est il pas déjà biaisé par ces attentes ?

je n'ai pas de préférence de classement...

jmguiche
jmguiche
Je ne comprend pas la question... ce que j’ecrivais Et que tu cites est une blague.
My top
No board game found
Acathla
Acathla
jmguiche dit :Je ne comprend pas la question... ce que j’ecrivais Et que tu cites est une blague.

Un petit smiley ...😇
j'ai vu ici (TT) des discussions terminer aux douves pour moins que ça...edit
pas la blague mais la tempête qu'elle déclenche...

jmguiche
jmguiche
Acathla dit :
jmguiche dit :Je ne comprend pas la question... ce que j’ecrivais Et que tu cites est une blague.

Un petit smiley ...😇
j'ai vu ici (TT) des discussions terminer aux douves pour moins que ça...edit
pas la blague mais la tempête qu'elle déclenche...

Oui mais il faut prendre le lagrangien de la discussion pour savoir si elle doit finir dans les douves.
(Ça ne veut rien dire mais n'importe quel bricolage pseudo mathématique rend tout plus légitime dans notre monde).

My top
No board game found
Vicen
Vicen
MasterMindM dit :
Si on suppose(1) 
 - que la complexité n'a aucun impact sur la qualité d'un jeu
 - que les gens notent la qualité(2) d'un jeu indépendamment de la complexité

alors la moyenne des notes des jeux complexes devrait être sensiblement égale à la moyenne des notes des jeux simples.

 

Faux de mon point de vue.

Si un groupe A a la caractéristique X et un Groupe B possède la caractéristique Y. Rien ne présuppose quand moyenne ils doivent être (ou seront) égaux vis à vis de la donnée Z.

My top
MasterMindM
MasterMindM
Vicen dit :
MasterMindM dit :
Si on suppose(1) 
 - que la complexité n'a aucun impact sur la qualité d'un jeu
 - que les gens notent la qualité(2) d'un jeu indépendamment de la complexité

alors la moyenne des notes des jeux complexes devrait être sensiblement égale à la moyenne des notes des jeux simples.

 

Faux de mon point de vue.

Si un groupe A a la caractéristique X et un Groupe B possède la caractéristique Y. Rien ne présuppose quand moyenne ils doivent être (ou seront) égaux vis à vis de la donnée Z.

J'ai tout a fait pu dire des bêtises !

Mais j'avoue ne pas avoir compris ton explication :)

Je suppose que A et B sont les jeux complexes et les jeux simples ? Et du coup Z doit représenter leur note ?


Si je prends un exemple : j'ai des pièces rouge (5 centimes) et des pièces jaune (20 centime), dans mon porte-monnaie (l'ensemble des pièces).

Je pars du principe que la couleur / le métal des pièces n'a pas d'influence sur la physique de la pièce, je dois logiquement avoir la même moyenne de faire des piles ou des faces en lançant des pièces. Si avec un grand échantillon un écart se distingue entre les deux groupes, c'est que probablement le couleur / le métal à une influence (même indirect, du style 'le lanceur de pièce lance plus fort les pièces jaune car il a l'impression d'être plus riche', ou autre).

Si je prends un autre exemple (parce que j'aime pas les pièces) : j'ai des gens qui vivent à Paris et des gens qui vivent à Marseille, qui sont dans ma population de français.

Je pars du principe que la situation géographique ne joue par sur le fait que les gens soient gauchers ou droitiers. Normalement je dois avoir sensiblement la même proportion de gaucher à Paris qu'à Marseille. Si ce n'est pas le cas, a priori une raison doit en être la cause (à Paris c'est stylé d'être gaucher donc les gens font semblant, au XIXeme siècle les gauchers étaient déportés à Marseille et la caractéristique est héréditaire, ... ).

My top
MasterMindM
MasterMindM
jmguiche dit :

Oui. D'ailleurs tout les classements qui ne reflètent pas mon avis son nul et il faut faire plein de manip en phyton dessus pour les rendre justes.

C'est ton avis, que je classe juste en haut de l'échelle de la répartie :)

My top
Juillet
Juillet
Alfa dit :
jmguiche dit :Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexe)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.

As tu bien lu le premier post et l’article associé ? La corrélation est avérée. 
Une proposition de correction est faite pour supprimer la corrélation poids/note. 
On se retrouve avc un classements qui ne comporte plus de corrélation avec la complexité du jeu. 
Si tu penses que les jeux complexes sont les meilleurs, ça ne te plaira pas. Si tu penses comme moi que les 2 paramètres sont théoriquement  indépendants, le classement corrigé est meilleur car il ne présente plus cette aberration.  

C'est une erreur fréquente de confondre corrélation et causalité, on l'observe fréquemment dans les pseudo analyses de sondages faites par les journalistes. Une corrélation indique juste... une corrélation. C'est une erreur de logique de conclure à une causalité.
Voir l'article de Wikipédia, très bien fait, à ce sujet :
https://fr.wikipedia.org/wiki/Corr%C3%A9lation_(statistiques)#Relation_de_cause_%C3%A0_effet
Partant de là, comme jmguiche, je trouve tout à fait manipulatoire de vouloir "corriger" une corrélation sur les données d'un classement, c'est la porte ouverte à absolument tout et n'importe quoi et cela n'a absolument aucune valeur. On est dans la pure manipulation de données...

My top
No board game found
Acathla
Acathla
Moi je manipule les classements en surnotant les jeux que j'aime bien et en sous notant les jeux que je n'aime pas...😎
Default
jmguiche
jmguiche
Juillet dit :
Alfa dit :
jmguiche dit :Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexe)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.

As tu bien lu le premier post et l’article associé ? La corrélation est avérée. 
Une proposition de correction est faite pour supprimer la corrélation poids/note. 
On se retrouve avc un classements qui ne comporte plus de corrélation avec la complexité du jeu. 
Si tu penses que les jeux complexes sont les meilleurs, ça ne te plaira pas. Si tu penses comme moi que les 2 paramètres sont théoriquement  indépendants, le classement corrigé est meilleur car il ne présente plus cette aberration.  

C'est une erreur fréquente de confondre corrélation et causalité, on l'observe fréquemment dans les pseudo analyses de sondages faites par les journalistes. Une corrélation indique juste... une corrélation. C'est une erreur de logique de conclure à une causalité.
Voir l'article de Wikipédia, très bien fait, à ce sujet :
https://fr.wikipedia.org/wiki/Corr%C3%A9lation_(statistiques)#Relation_de_cause_%C3%A0_effet
Partant de là, comme jmguiche, je trouve tout à fait manipulatoire de vouloir "corriger" une corrélation sur les données d'un classement, c'est la porte ouverte à absolument tout et n'importe quoi et cela n'a absolument aucune valeur. On est dans la pure manipulation de données...

De toutes façons, pour autant que je sache,  ces manip ne se font pas, elles n’ont pas de sens.
Quand on analyse un phénomène avec plusieurs variables (même) corrélées, on fait de l’analyse en composante principale, pour comprendre ce qui se passe. C’est inutile quand on n’en a que deux, comme ici, ou il est facile de voir ce qui se passe.
 

My top
No board game found
Alfa
Alfa
Juillet dit :
Alfa dit :
jmguiche dit :Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexe)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.

As tu bien lu le premier post et l’article associé ? La corrélation est avérée. 
Une proposition de correction est faite pour supprimer la corrélation poids/note. 
On se retrouve avc un classements qui ne comporte plus de corrélation avec la complexité du jeu. 
Si tu penses que les jeux complexes sont les meilleurs, ça ne te plaira pas. Si tu penses comme moi que les 2 paramètres sont théoriquement  indépendants, le classement corrigé est meilleur car il ne présente plus cette aberration.  

C'est une erreur fréquente de confondre corrélation et causalité, on l'observe fréquemment dans les pseudo analyses de sondages faites par les journalistes. Une corrélation indique juste... une corrélation. C'est une erreur de logique de conclure à une causalité.
Voir l'article de Wikipédia, très bien fait, à ce sujet :
https://fr.wikipedia.org/wiki/Corr%C3%A9lation_(statistiques)#Relation_de_cause_%C3%A0_effet
Partant de là, comme jmguiche, je trouve tout à fait manipulatoire de vouloir "corriger" une corrélation sur les données d'un classement, c'est la porte ouverte à absolument tout et n'importe quoi et cela n'a absolument aucune valeur. On est dans la pure manipulation de données...

À quel moment y a-t-il confusion entre corrélation et causalité ? On n’a jamais parlé de causalité il me semble...
Il est question ici d’une correlation observée , que certains d’entre nous trouvent sans fondement. 

Juillet
Juillet
Alfa dit :
Juillet dit :
Alfa dit :
jmguiche dit :Mais que signifiera le classement pondéré, si ce n'est "voici le classement, pondéré par la complexité des jeux, obtenu en bricolant les avis des gens de BGG (qui sont des amateurs de jeux complexe)" ?

Cela ne signifiera rien de plus, c'est à dire que cela ne signifiera a peu près rien, plutot moins que le classement initial (ou on pouvait considérer avoir un bon classement des jeu complexes).

Cela signifie moins que "je veux le classement BGG des jeux de complexité inférieur à X", liste simple a obtenir, et qui me donne un classement des jeux de complexité faible vu par une population aimant plutot les jeux complexes.

Donc ça sert à rien.

Ça n'a aucune valeur statistique.

As tu bien lu le premier post et l’article associé ? La corrélation est avérée. 
Une proposition de correction est faite pour supprimer la corrélation poids/note. 
On se retrouve avc un classements qui ne comporte plus de corrélation avec la complexité du jeu. 
Si tu penses que les jeux complexes sont les meilleurs, ça ne te plaira pas. Si tu penses comme moi que les 2 paramètres sont théoriquement  indépendants, le classement corrigé est meilleur car il ne présente plus cette aberration.  

C'est une erreur fréquente de confondre corrélation et causalité, on l'observe fréquemment dans les pseudo analyses de sondages faites par les journalistes. Une corrélation indique juste... une corrélation. C'est une erreur de logique de conclure à une causalité.
Voir l'article de Wikipédia, très bien fait, à ce sujet :
https://fr.wikipedia.org/wiki/Corr%C3%A9lation_(statistiques)#Relation_de_cause_%C3%A0_effet
Partant de là, comme jmguiche, je trouve tout à fait manipulatoire de vouloir "corriger" une corrélation sur les données d'un classement, c'est la porte ouverte à absolument tout et n'importe quoi et cela n'a absolument aucune valeur. On est dans la pure manipulation de données...

À quel moment y a-t-il confusion entre corrélation et causalité ? On n’a jamais parlé de causalité il me semble...
Il est question ici d’une correlation observée , que certains d’entre nous trouvent sans fondement. 

C'est pourtant ce qui ressort de la discussion sur ce fil. C'est le sujet de l'article initial, vouloir "corriger" une corrélation observée sur les données d'un classement. Cela n'a  pas de sens et revient simplement à manipuler le classement. Quant à déclarer qu'une corrélation est "sans fondement" à priori, c'est aussi absurde que d'y voir une causalité. Une corrélation n'est qu'une corrélation, elle peut signifier quelque chose ou rien du tout mais pour le savoir il faut réaliser une investigation supplémentaire sur les données pour savoir quel est la nature du lien observé entre les données corrélées.
Si la corrélation observée dans le classement de BGG entre la complexité des jeux et leur note est "sans fondement", c'est à dire purement fortuite, il n'y a dés lors aucun besoin de "rectifier" le classement (ce qui est déjà absurde en soi).
Le seul cas où de tels classements peuvent être retouchés à posteriori concerne les biais de représentativité de l'échantillonnage, c'est ce qui s'observe sur certains types sondages lorsqu'on veut pondérer certaines populations ou variables trop faiblement représentées dans l'échantillonnage (et là aussi ces méthodes sont discutables et discutées).
Tout ce que l'on peut dire sur le classement BGG c'est que oui, les jeux complexes sont davantage représentés dans le haut du classement, parce que les votants de BGG attribuent en moyenne de meilleures notes aux jeux complexes. Ils attribuent en moyenne de meilleures notes aux jeux complexes parce qu'ils préfèrent les jeux complexes, on peut déduire cela  parce que c'est précisément la préférence que mesure un système de notation.
Ce n'est donc pas parce qu'un jeu est "complexe" qu'il est mieux noté, mais parce que les votants préfèrent ce type de jeux.
A partir de là, retraiter ce classement pour "corriger" cette corrélation revient à "corriger" les goûts des votants de BGG, ce qui est totalement manipulatoire...

My top
No board game found
jmguiche
jmguiche
@juillet

ben oui.
My top
No board game found
MasterMindM
MasterMindM
Juillet dit :

(...)
Le seul cas où de tels classements peuvent être retouchés à posteriori concerne les biais de représentativité de l'échantillonnage, c'est ce qui s'observe sur certains types sondages lorsqu'on veut pondérer certaines populations ou variables trop faiblement représentées dans l'échantillonnage (et là aussi ces méthodes sont discutables et discutées).
(...)

De ce que j'ai compris c'est exactement ce dont il est question ici : l'hypothèse supposée (que personne n'a pas prouvé jusque ici), c'est que "l'échantillon des votants" n'est pas représentatif de la population des "joueurs".

En effet, il y aurait parmi les votants une proportion de 'gros joueurs préférant les jeux complexes' supérieur à la proportion sur l'ensemble des joueurs (hypothèse 1).

La 'correction' proposée sur le classement a donc pour but de corriger ce biais de représentation (à partir du moment où on accepte l'hypothèse 1, qui est bien sûr réfutable), pour extrapoler les résultats obtenus sur la population des votants et en déduire un chiffre théorique sur la population des joueurs.

My top
jmguiche
jmguiche
C’est exactement cela.
Sauf que, en statistique, ce n’est pas en bricolant les données de bases, les notes données par les gens, qu’on « corrige » le fait que la population sondée n’est pas représentative de la population que l’on souhaite connaître.

On fait ça en pondérant les avis en fonction de la représentativité. « Dans mon échantillon, il me manque des jeunes actifs de 18 25 ans, je vais donc donner plus de poids aux avis de cette population dans mon échantillon » (c’est un peu plus compliqué, mais c’est l’idée. C’est comme cela qu’on obtient « 98% de sondages justes à 3% ». Pas en disant « boarf, mon échantillon il vote trop à droite à mon avis alors je vais faire une péréquation en les faisant voter un peu plus à gauche pour tomber « juste » » (ce qui signifie qu’on connaît la réponse avant même de poser la question, lol).

En bricolant les résultats, on ne fait que perdre de l’info et on obtient un classement dénué de sens.
My top
No board game found
jmguiche
jmguiche
La liste d’hypotheseS discutables est bien plus longue de toute façon.

H0 : la qualité « absolue » (ça veut dire quoi ?) d’un jeu est indépendant de sa complexité 
H1 : mes votants privilégient le complexe.
H2 : les joueurs dans leur ensemble ont un goût uniforme pour la complexité (mon intuition me fait croire que c’est plutôt gaussien, il y a même peut être superposition de plusieurs gaussiennes. En effet, je pense qu’il y a une population de war gamers dont lla tolerance à la complexité est supérieur à la population de joueurs plutôt eurogame dont la tolérance est elle même supérieure à celle des amateurs orientés jeux d’ambiance et jeux « simple » style cocktail game. Cette dernière tranche de population est par ailleurs très peu présente sur les sites spécialisés mais très importantes je pense)
H3 : le pivot pour la complexité est la complexité moyenne (dans la transformation, les jeux de complexité moyenne ne changent pas de notes. Cela peut sembler être un corolere de H2, mais ce n’est pas le cas, c’est un complément qui n’a de sens que si H2 est vrai, on pourrait considérer que le pivot est au 1/3 par exemple).
H4: les goûts de mes votants sur les jeux simples est équivalent à celui des amateurs de jeux simples sur ces mêmes jeux simples.
H5 : les goûts des amateurs de jeux simples sur les jeux complexes est équivalent à celui des amateurs de jeux complexe sur ces mêmes jeux complexes
H6 : ... etc sur les amateurs de jeux de complexité moyenne, moyenne -, moyenne plus, tout Le continuum...
H7 : il n’y a pas d’effet panurge dans les notes (ce qui rendrait illusoire toute recherche de classement qualitatif absolu et neutre)
H8 : le marketing, influant sur la connaissance qu’a ma population d’un jeu, n’iinfluent Pas sur la note. (Idem)
...
etc.

Et il y a un truc qui n’est pas défini : le classement que je souhaite obtenir est reprensentatif de quelle population ? Celle des joueurs ? C’est quoi un joueur ? Quand commence t on à être un joueur ? Quand commence t on à être un joueur dont l’avis fait sens ? (J’ai des amis joueurs qui connaissent le Monopoly et ne jouent qu’au bridge et aux colons de catane, ça compte comme avis ?)

bref, autant d’affirmations gratuites, sous entendues mais probablement même pas imaginées par l’auteur, et d’absence de cadrage qui font que l’exercice donne « l’avis pondéré par la complexité des votants de bgg »
en résumé, on a perdu de l’info et on n’en a pas gagné.
si on suppose que les votants privilégient le complexe, à quoi sert un classement fait par ces mêmes personnes quand on gomme la complexité de façon arbitraire qui plus est ? (Pivot à la moyenne).

En résumé, si les statisticiens ne font pas (a ma connaissance, ce n’etait pas ma matière principale mais j’en ai quand même bouffé pendant 5 ans après le bac) ce genre de choses (modifier les données), c’est pas pour rien !
 
My top
No board game found
Juillet
Juillet
MasterMindM dit :
Juillet dit :

(...)
Le seul cas où de tels classements peuvent être retouchés à posteriori concerne les biais de représentativité de l'échantillonnage, c'est ce qui s'observe sur certains types sondages lorsqu'on veut pondérer certaines populations ou variables trop faiblement représentées dans l'échantillonnage (et là aussi ces méthodes sont discutables et discutées).
(...)

De ce que j'ai compris c'est exactement ce dont il est question ici : l'hypothèse supposée (que personne n'a pas prouvé jusque ici), c'est que "l'échantillon des votants" n'est pas représentatif de la population des "joueurs".

En effet, il y aurait parmi les votants une proportion de 'gros joueurs préférant les jeux complexes' supérieur à la proportion sur l'ensemble des joueurs (hypothèse 1).

La 'correction' proposée sur le classement a donc pour but de corriger ce biais de représentation (à partir du moment où on accepte l'hypothèse 1, qui est bien sûr réfutable), pour extrapoler les résultats obtenus sur la population des votants et en déduire un chiffre théorique sur la population des joueurs.

Il n'y a aucun "biais de représentation" à corriger car le classement BGG ne représente que les goûts des votants sur le site BGG, il  n'a pas la prétention de constituer un reflet de l'opinion dans son ensemble à la manière d'une enquête d'un institut de sondage, c'est une confusion. Dés lors, si vous corrigez des "biais" qui n'existent pas, car on ne se situe pas ici dans le sondage d'opinion, vous déformez et manipulez le classement.
Le classement BGG reflète les goûts des joueurs qui fréquentent BGG et n'a pas d'autre objectif, si vous voulez le "corriger" pour lui faire dire autre chose, c'est une manipulation.

My top
No board game found
Cyril1211
Cyril1211
Et Kamoulox, on en parle...? Parce que perso, j'ai jamais rien compris, il doit être bon alors...
My top
No board game found
jmguiche
jmguiche
Juillet dit :
MasterMindM dit :
Juillet dit :

(...)
Le seul cas où de tels classements peuvent être retouchés à posteriori concerne les biais de représentativité de l'échantillonnage, c'est ce qui s'observe sur certains types sondages lorsqu'on veut pondérer certaines populations ou variables trop faiblement représentées dans l'échantillonnage (et là aussi ces méthodes sont discutables et discutées).
(...)

De ce que j'ai compris c'est exactement ce dont il est question ici : l'hypothèse supposée (que personne n'a pas prouvé jusque ici), c'est que "l'échantillon des votants" n'est pas représentatif de la population des "joueurs".

En effet, il y aurait parmi les votants une proportion de 'gros joueurs préférant les jeux complexes' supérieur à la proportion sur l'ensemble des joueurs (hypothèse 1).

La 'correction' proposée sur le classement a donc pour but de corriger ce biais de représentation (à partir du moment où on accepte l'hypothèse 1, qui est bien sûr réfutable), pour extrapoler les résultats obtenus sur la population des votants et en déduire un chiffre théorique sur la population des joueurs.

Il n'y a aucun "biais de représentation" à corriger car le classement BGG ne représente que les goûts des votants sur le site BGG, il  n'a pas la prétention de constituer un reflet de l'opinion dans son ensemble à la manière d'une enquête d'un institut de sondage, c'est une confusion. Dés lors, si vous corrigez des "biais" qui n'existent pas, car on ne se situe pas ici dans le sondage d'opinion, vous déformez et manipulez le classement.
Le classement BGG reflète les goûts des joueurs qui fréquentent BGG et n'a pas d'autre objectif, si vous voulez le "corriger" pour lui faire dire autre chose, c'est une manipulation.

Même dans un sondage d’opinion on ne fait pas comme ça. On travaille sur l’échantillonnage et sa correspondance avec la population complète, pas sur les données de bases.

My top
No board game found
Default
Acathla
Acathla
Et si l'hypothèse est :
les "joueurs" surnotent les jeux complexes et sous notent(ou ne notent pas) les jeux simples, parce que (on s'en fout de la raison...) (parce que ca fait mieux...)
c'est une hypothèse valable...(manipulation ?🤔😇)

après le bidouillage...
un classement c'est déjà du bidouillage...
Je suis sur qu'il y a un calcul/algorithme dans le classement bgg...

mais du coup si on ne prend que les jeux des 12 derniers mois pour faire un classement  ...est ce que c'est considérer comme du bidouillage au même titre que vouloir annuler le "biais dû à la complexité"..?
Vicen
Vicen
jmguiche dit :C’est exactement cela.
Sauf que, en statistique, ce n’est pas en bricolant les données de bases, les notes données par les gens, qu’on « corrige » le fait que la population sondée n’est pas représentative de la population que l’on souhaite connaître.

On fait ça en pondérant les avis en fonction de la représentativité. « Dans mon échantillon, il me manque des jeunes actifs de 18 25 ans, je vais donc donner plus de poids aux avis de cette population dans mon échantillon » (c’est un peu plus compliqué, mais c’est l’idée. C’est comme cela qu’on obtient « 98% de sondages justes à 3% ». Pas en disant « boarf, mon échantillon il vote trop à droite à mon avis alors je vais faire une péréquation en les faisant voter un peu plus à gauche pour tomber « juste » » (ce qui signifie qu’on connaît la réponse avant même de poser la question, lol).

En bricolant les résultats, on ne fait que perdre de l’info et on obtient un classement dénué de sens.

Pour moi ce message est le plus explicite du topic.

My top