Stats

Stats #5 Correlation does not equal causation : ok, mais pourquoi?

Vous avez peut-être déjà entendu cette maxime, qui insiste sur le fait que corrélation n’implique pas toujours causalité.  On va explorer ici les multiples cas de figure où une corrélation peut être observée sans qu’il n’y ait absolument aucun lien de causalité sous-jacent.

Cas de figure 1 : la pure coïncidence.

En statistiques, si on apprend un truc, c’est que quand on cherche… on trouve. Lorsque l’on fait des statistiques dans tous les sens, il y a une infinité de combinaisons possibles, si bien que par pure coïncidence, on puisse trouver des corrélations totalement fortuites. A tel point qu’un site, Spurious corrélations, s’est donné pour mission de répertorier les corrélations les plus absurdes. Par exemple, cette corrélation entre la consommation de margarine et le taux de divorce dans l’état du Maine, aux USA. Pour commencer à suspecter un lien de cause à effet lorsqu’il y a une corrélation, la première exigence, c’est d’avoir, a priori, des raisons logiques de penser qu’il puisse y avoir un lien de cause à effet. La seconde, c’est qu’un pattern devrait se retrouver dans différents contextes sans trop d’altération. Ici, les données sont réduites à l’état du Maine, et il est probable que si on regardait la corrélation dans d’autres états… on ne la retrouverait pas.

SpuriousCorrelation

Cas de figure 2 : une cause commune

Imaginons, vous tombez sur un article qui montre qu’il y a une corrélation entre le fait d’être en surpoids et le risque de maladies cardiaques. Cela fait sens. Le surpoids consiste en l’accumulation de graisses, et ce sont les acides gras qui provoquent des accidents cardiaques. Cependant, une telle corrélation pourrait tout aussi bien être due au schéma suivant :

corrcaus1

Si tel était le cas, une thérapie qui consisterait à perdre du poids n’aurait aucune incidence sur les maladies cardiaques, car elle n’agirait pas sur la cause réelle des maladies cardiaques : la musculation du coeur. Pour inférer un lien de causalité entre le poids et les maladies cardiaques, dans ce cas, il va être nécessaire de « stratifier » l’échantillon d’étude. Il faudra faire plusieurs groupes d’individus en fonction du degré de musculation du cœur, et regarder si la corrélation entre le poids et l’occurrence des maladies cardiaque persiste… à l’intérieur de chacun de ses groupes. En effet, à l’intérieur de chaque groupe, tout le monde ayant la même musculature cardiaque, les différences qui seraient observées seraient réellement liées au poids. Et il est tout à fait possible que les deux variables aient un effet, évidemment.

Cas de figure 3 : ce n’est pas A qui cause B, mais B qui cause A (causalité inversée).

Imaginons que les femmes soient (en moyenne) moins payées que les hommes, et qu’en cherchant à décomposer les causes de cette différence, on se rende compte que les femmes occupent plus souvent des emplois moins bien payés que les hommes. On pourrait s’empresser de conclure que les femmes gagnent moins que les hommes parce qu’elles choisissent des emplois moins bien rémunérés. Mais ce serait oublier que la causalité peut tout aussi bien être inversée : les emplois plus souvent occupés par les femmes auraient une rémunération moyenne inférieure aux emplois plus souvent occupés par les hommes, parce que les femmes sont discriminées.

autismecausevaccines

Cas de figure 4 : la causalité sans corrélation

Pour terminer, un petit cas particulier. Peut-il y avoir un lien de causalité sans qu’on ait mesuré de corrélation ? Et bien même si c’est improbable, ce n’est pas impossible. Imaginez que vous compariez l’efficacité de deux traitements, A et B, sur une maladie. Vous ne trouvez aucun effet, l’efficacité comparée des deux traitements est identique, et vous publiez donc votre résultat dans le Journal of null results :

corrcaus2

Peu de temps après la publication, il y a votre pote Julie, qui est chimiste, qui a lu votre publi et qui vous dit : « hé j’ai vu ta publi, mais tu sais que A et B sont des molécules qui interagissent avec la caféine ? Tu devrais contrôler cette variable quand même ». Du coup, vous interrogez un peu vos patients, vous ré analysez les données, et là, que trouvez-vous ?

corrcaus3

Tadaaam. Vous trouvez que le traitement A est plus efficace chez les patients qui boivent du café, et B plus efficace chez les patients qui n’en boivent pas. Si on fait la moyenne des groupes en considérant qu’il y a à peu près autant de buveurs de café que de non buveurs de café, on retombe à peu près sur le graphe ci-dessus.

Alors, je parle de ce cas particulier, qui est assez improbable, parce que je l’ai déjà vu apparaitre chez des tenants de « médecines alternatives» (enfin, c’est rare, mais chez les plus malins), pour défendre l’idée que leur médecine fonctionne, mais que ça se voit pas dans les statistiques, parce que « ça dépends des individus ». Alors, oui, c’est une possibilité c’est vrai. Mais le truc, c’est que tant qu’on sait pas « de quelle manière ça dépends des individus », et bien…. ça sert à rien. Si je donne A et B aux individus sans savoir que A marche mieux pour certains et B pour d’autres parce que les uns boivent du café et d’autres pas, alors mon résultat, c’est le graphe du dessus : ça marche pas mieux avec un traitement que l’autre. Du coup, si jamais ils ont une idée claire de la raison pour laquelle leur médecine alternative n’est pas ‘statistiquement’ plus efficace qu’un placebo, mais qu’elle peut être efficace pour certains individus en particulier, alors c’est très simple : j’invite ces tenants à mettre en place un protocole qui teste l’efficacité de la médecine alternative en question en contrôlant explicitement la caractéristique des individus qu’ils utilisent comme indicateur de l’efficacité probable de cette médecine pour ces individus. Si ça marche, vous serez célèbres.

Comment s’assurer qu’une corrélation correspond à un lien de causalité?

Et bien, il y a quelques critères à vérifier,  notamment :

–        La temporalité (A se produit avant B).

–        La plausibilité (explication mécanique / coherence logique: ex la mutation kdr-R qui code l’allèle de résistance aux insecticides, pourrait générer un cout physiologique tel que le moustique dispose de moins de ressources pour lutter contre le parasite et pourrait être plus souvent infecté, donc je m’attends à observer une possible corrélation entre la présence de ce gène et le taux d’infection).

–        Gradient biologique (Plus de A correspond à plus de B: ex les hétérozygotes kdr-R/kdr-S sont moins infectés que les homozygotes kdr-R/kdr-R et plus infectés que les homozygotes kdr-S/kdr-S).

–        Consistance / pouvoir prédictif: le lien entre A et B est retrouvé dans de nombreux contexts et de nombreuses conditions (e.g. dans de nombreux sites d’étude ou populations)

–        Dégré de l’association ( / ou corrélation), taille d’effet élevée.

–        Spécificité: B est rarement trouvé sans A (mais souvenez vous que si A ->B, B peut aussi avoir plusieurs causes)

–        Préventabilité (test experimental : le gold standard): si A est supprimé, B disparait.

Si vous voulez un récap sur les différents niveaux de preuve et les études qui permettent de les obtenir, n’hésitez pas à relire cet autre billet.

Voilà, ce billet se sera fait attendre, mais c’est fait ! J’espère que vous aurez aimé.

Article originellement publié le 18 nov. 2017, republié le 07 mars 2018 suite à migration du site.

Publicité
Stats

Stats #4 Faire de son cas une généralité

Le bon sens le sait : il ne faut pas faire d’un cas une généralité. Pour autant, peut-on faire une généralité à partir de 2 cas ? de 10 cas ? de 20 cas ? On « sent bien» que plus il y aura de cas, plus notre généralité aura de chances d’être juste… cependant, pour que ce soit le cas, il y a deux conditions importantes à remplir : 1-avoir « assez » d’individus, et 2- que ces individus soient représentatifs.

1-      Avoir des individus représentatifs

Règle number one, très très importante : vous aurez beau avoir 1 million de cas, ils n’auront absolument aucune valeur si ces cas ne sont pas représentatifs de l’ensemble sur lequel vous voulez tirer une généralité.

Représentatif, ça veut dire quoi ? Cela signifie que les individus de mon échantillon doivent représenter la diversité des individus qui existent dans la population. Par exemple, si je veux étudier la taille des français, je dois faire mes mesures sur les français en général, donc avoir des grands, des petits, des moyens, et ce dans des proportions équivalentes à celles de la population française. En gros, si je dessinais la cloche des tailles à partir de mon échantillon d’individus, je dois obtenir à peu près la même que si j’avais mesuré la taille de tous les français sans exception.

Si je vais sur un chantier, et que je mesure tous les hommes présents, ma mesure me donnera une idée de la taille moyenne de l’ouvrier à l’endroit où j’ai été. Je n’ai pas le droit de généraliser à l’ensemble des hommes français, et encore moins à l’ensemble des français tout court (hommes et femmes). En effet, les hommes sont en moyenne plus grands que les femmes, donc en ayant un échantillon qui n’est formé que d’hommes, je surestimerais la taille moyenne de la population française. On dit que si l’échantillon n’est pas représentatif, notre « estimation» de la taille moyenne est biaisée.

Pour obtenir un échantillon représentatif, il existe des méthodes. Je ne vais pas rentrer dans les détails techniques, mais il y a une règle à connaître : plus les individus sont sélectionnés au hasard, mieux c’est. Ainsi, la meilleure de toutes les méthodes, dans l’idéal, serait d’avoir la liste de tous les français, et de tirer le nombre d’individus que l’on souhaite au hasard dans cette liste. Ainsi, on aura des individus de tout genre, toute origine sociale, tout age, etc. Ils seront représentatifs de la population française.

Lorsque l’on fait de son cas (ou des quelques cas qu’on a croisé dans sa vie…) une généralité, on risque très fort de ne pas avoir un échantillon représentatif, mais un échantillon biaisé. En effet, en tant qu’individu, qui que l’on soit, au minimum, on côtoie un certain milieu social spécifique, on a accès ou non à certains services, on ne vit qu’à un seul endroit à la fois. Qui que l’on soit, on n’a donc accès qu’à une partie restreinte de la population, et on ne devrait donc jamais faire de généralités à partir de nos observations « personnelles». Ca ne veut pas dire que les observations personnelles n’ont aucune valeur. Elles permettent de formuler des hypothèses… qu’on pourra ensuite tester avec la méthode scientifique.

(Ou vérifier en consultant -vive internet- ce qu’en disent les études qui les ont testé… jetez déjà un œil à la compilation de Tatoufaux, vous verrez sans doute, comme moi, quelques unes des « généralités» que vous croyiez belles et bien acquises tomber à l’eau…).

FigFaire de son cas une généralité

2-      Avoir assez d’individus

C’est la grande question que posent absolument tous les étudiants en science lors de leur premier stage de recherche, quand ils doivent mettre au point leur tout premier protocole expérimental : combien de « réplications » (=cas) doivent-ils prévoir (c’est-à-dire, si c’est une expérience sur les rats, par exemple, combien de rats)? A tous, on répond la même chose : « Ca dépend» ! Très frustrant, comme réponse, n’est ce pas ?

Et pourtant, là n’est pas le pire, il y a encore plus frustrant : le nombre d’individus qu’il faut, ça dépend des données elles-mêmes… donc on ne peut le mesurer qu’après l’expérience… quand on a les données. Du coup, on ne sait pas si on a prévu assez de réplications tant qu’on n’a pas terminé la recherche, et fait quelques calculs.

Alors, quels calculs ? De quoi « ça dépend» le nombre d’individus qu’il faut ? On l’a dit, pour avoir un échantillon représentatif, la meilleure méthode est de tirer les individus au hasard. Cependant, même en tirant les individus au hasard, il existe un risque, en étant très malchanceux, que l’échantillon obtenu soit très différent, dans sa composition, de la population sur laquelle on veut faire une généralité. Pour mieux comprendre, imaginons : j’ai une population d’allemand, et d’après un recensement, je sais que la moitié d’entre eux, très exactement, aime les fraises (j’admets, c’est une question bizarre pour un recensement, mais c’est pour l’exemple, il faut faire preuve d’ouverture d’esprit).

Je veux savoir si pour les français c’est pareil, si la moitié d’entre eux aime les fraises.

Je tire 10 français au hasard. Si effectivement comme pour les allemands, la moitié aime les fraises, j’ai de bonnes chances d’avoir environ la moitié de mes dix individus tirés au hasard qui aiment les fraises. Si j’en conclue que les français sont comme les allemands (ie que la moitié des français aiment les fraises), j’ai de la chance, j’ai bon.

Mais j’ai aussi une probabilité non nulle de ne tirer, par malchance, que des français qui aiment les fraises, ou que des français qui n’aiment pas les fraises. Et là, si je conclue que les français sont différents des allemands, pas de bol, j’ai faux.

Encore une frustration : même en ayant tout bien fait comme il faut pour avoir un échantillon représentatif (c’est-à-dire même en ayant utilisé le hasard), il y a un risque de tirer de mauvaises conclusions, un risque d’erreur.

L’énorme différence entre l’erreur et le biais (le biais c’est ce qu’on a vu en 1ere partie, faut suivre), c’est qu’avec le biais, on ne sait jamais à quel point on se trompe dans nos conclusions… et ça, c’est pas bon. L’erreur, par contre, on peut calculer sa probabilité. Par exemple, pour les français qui aiment ou non les fraises, on peut calculer la probabilité de tirer autant de français qui aiment les fraises alors qu’il y avait moitié-moitié dans la population… cette probabilité, c’est (environ) 1/210 (1/2 car on a une chance sur deux de tirer un individu qui aime les fraise à chaque tirage, et exposant 10 car on fait dix tirages), soit (environ) 0,001, soit 0,1%. En gros, il aurait été très improbable (moins d’une chance sur 100) de ne tirer que des individus qui aiment les fraises s’il y avait moitié-moitié. Si je ne tire que des individus qui aiment les fraises, je prends donc un risque plutôt faible en concluant qu’il n’y a pas moitié-moitié dans la population, donc que les français sont différents des allemands. Dans le cas présent, 10 individus étaient suffisants pour tirer une conclusion.

Je reformule, pour être sure que le message passe: on aura toujours un risque, à cause du hasard, de faire une fausse conclusion. Mais ce risque, on peut le calculer. S’il est faible, on pourra conclure, donc c’est qu’on avait prévu assez d’individus dans notre échantillon.

Si je n’avais tiré que 4 individus, et que tous aimaient les fraises, la probabilité aurait été de 1/24 soit environ 6%… c’est déjà un risque plus important, qu’on est pas forcément prêt à prendre… on fera alors une nouvelle étude, avec plus d’individus, pour avoir un risque plus « acceptable» avant de tirer une conclusion.

Lorsque l’on fait de son cas une généralité, on a bien souvent aucune idée du nombre d’individus qu’il aurait fallu pour conclure… donc du risque qu’on prend de se tromper. Encore un argument pour préférer la méthode scientifique à l’approche individuelle.

Publié originellement le 7 avr. 2015 et republié le 07 mars 2018 suite à migration du site.

Stats

Stats #3 Le pourcentage qui fait peur

Suite à un fait divers (un délinquant à brûlé une voiture, et c’est une récidive, il avait déjà été arrêté et incarcéré pour le même motif auparavant), un journal publie un chiffre effarant : 66% des brûleurs de voiture sont des récidivistes. Ce chiffre suffit-il pour conclure que décidément, il ne faut que des peines « à vie» car « la récidive, ça suffit bon sang» ?

Voici ce à quoi pourraient ressembler les données au complet, qui ne sont jamais données dans les articles de ce genre.

tableau

Pour savoir si les récidivistes sont plus souvent impliqués dans les délits que les non récidivistes, 1000 personnes ont été suivies. Une partie d’entre elles avait un passé judiciaire (C=Casier), l’autre partie pas de passé judiciaire (NC= pas de casier). Au bout de 5 ans, on regarde si ces personnes ont oui ou non brulé une voiture pendant ces 5 ans.

On a bien 4 récidivistes et seulement 2 non récidivistes parmis les (6) bruleurs de voiture. 4/6*100 = 66%
Par contre, on voit aussi que parmis ceux qui avaient un casier, seulement 4/67, soit environ 6%, ont récidivé. 94% n’ont jamais récidivé.

Je vous laisse conclure quand à savoir si ceux qui ont brulé une voiture une fois méritent généralement une seconde chance ou devraient être emprisonnés à vie.

Edit 01/07/2019 : pour ceux qui auraient vu le lien vers ce blog apparaitre dans les commentaires suite à l’encart de l’ASTEC, j’ai supprimé pour l’instant, je prends un peu plus de temps pour compléter, voir j’envisage un article distinct.

Stats

Stats #2 Généralisation du concept de généralité

Lorsqu’on a regardé si les allemands étaient plus grands que les français, on avait « des données» : un tableau avec la taille et la nationalité de plein de gens (des allemands et des français seulement par contre, car des chinois ça aurait un peu servi à rien pour savoir si les allemands étaient plus grands que les français, n’est-ce pas).

Avec ces jolies données, on pouvait faire deux groupes (celui des allemands d’un coté, et celui des français de l’autre), et pour chaque groupe, on pouvait faire une cloche dont le sommet représentait la moyenne de taille du groupe, et les bords représentaient les tailles minimum et maximum. On dessinait ces cloches en découpant les tailles possibles en classes, et en mettant pour chaque classe une barre dont la hauteur était égale au nombre de personne appartenant à cette classe (ok, lien pour rappel). Du coup, pour comparer les groupes, on pouvait comparer les cloches (et surtout, voir si elles étaient superposées).

Maintenant, imaginons qu’on se pose une autre question, à savoir : les français aiment-ils plus les fraises que les allemands ?

Je peux toujours faire deux groupes (les français d’un coté, et les allemands  de l’autre). Mais si la deuxième information que l’on a c’est si les personnes aiment les fraises ou pas (oui/ non). Donc, mes données ont cette tête là :

Individu Nationalité Aime les fraises
1 Français Oui
2 Francais Oui
3 Allemand Oui
4 Français Oui
5 Allemand Non
6 Allemand Oui
etc etc etc

Je vais avoir du mal à dessiner une cloche avec ces oui et ces non…

On va devoir utiliser une petite astuce pour retomber sur des chiffres que l’on puisse comparer. L’astuce, c’est bien sur de compter le nombre de oui chez les français, et le nombre de oui chez les allemands. J’ai 1121 français qui me répondent « oui, j’aime les fraises», et seulement 374 allemands. Puis-je conclure que les français aiment plus les fraises que les allemands ? Compter les oui suffit-il ? Attention, il y a un piège.

Non, cela ne suffit pas ! Imaginons que parmi mes 2000 personnes, j’ai 1500 français, et seulement 500 allemands ! Alors évidemment c’est logique que je n’ai pas 1121 allemands qui me répondent « oui, j’aime les fraises».

A aucun moment je n’ai dit ni vérifié que j’avais le même nombre de français et d’allemands dans mon tableau (même pas dans mon post #2, cherchez pas j’ai vérifié).

Donc ! Je dois aussi compter le nombre total d’individus dans les groupes que je compare. Ou alors le nombre de non. Je peux représenter les données dans un nouveau tableau :

Nationalité Aime les fraise=Oui Aime les fraise=Non TOTAL
Français 1121 379 1500
Allemand 374 126 500

Bon, du coup, ça fait beaucoup de chiffres… pour la taille, on pouvait comparer le sommet des cloches, qui correspondaient aux moyennes, et basta. Là, on doit comparer quoi avec quoi ? Il y a plusieurs manière de faire, mais en gros, ce qu’on veut savoir, c’est si en proportion, les français aiment plus les fraises que les allemands. On peut donc calculer les proportions de fraises-lovers dans chaque groupe :

Français : 1121 /  1500 * 100 = 74,7%

Cela signifie que 74,7% des français aiment les fraises d’après mes données.

Alors, et les allemands ? Roulement de tambour :

Allemands : 374 / 500 * 100 = 74,8%

Les deux pourcentages sont sensiblement identiques.

Conclusion : on dirait bien que les allemands aiment autant les fraises que les français !

De quoi créer des conflits lors des jumelages… les points communs n’ont pas que du bon.

Bon cet article est déjà long, et je n’ai pas terminé. Bah oui, je n’ai pas encore parlé du dernier cas possible de généralités. Le cas où on veut savoir si on a des grandes mains quand on a des grands pieds (plus rien à voir avec les allemands et les français…). Un cas où on aurait comme données un truc comme ça :

Individu Largeur de la main Longueur du pied
1

9,4

13,2

2

9

12,5

3

11

14,8

4

9,5

12,9

5

10,4

14

6

12,6

16,1

etc etc etc

Donc que des chiffres. Là, je peux pas faire deux groupes et les comparer. J’ai donc un nouveau problème. La manière typique de représenter ces données, c’est le nuage de points, c’est à dire ça :
PiedsMains1

Chaque point correspond à une personne (pour chaque personne, on a mesuré une main, et un pied). Là, on voit bien que lorsque la taille de la main est petite, le pied aussi est petit. Mais attention il y a des exceptions. Par exemple :

PiedsMains

Içi, la personne notée 1 à une main plus grande que la personne notée 2, mais un pied un peu plus petit. Les points pourraient être plus ‘dispersés’, et dans ce cas on aurait encore plus d’exceptions. Bref, içi, on a bien envie de dire juste avec le graphique qu’effectivement les gens qui ont de grandes mains ont en général de grands pieds. Il y a… corrélation !

Mais quand on fait des statistiques sérieusement, et surtout, quand les données sont plus dispersées, les graphiques ne suffisent pas (l’oeil humain n’est pas assez fiable), et on a alors besoin de calculer un coefficient de corrélation qui nous dira ce qu’il en est. Ce « coefficient» sera compris entre -1 et 1… et plus exactement, il sera très proche de zéro s’il n’y a pas de corrélation, proche de 1 s’il y a une corrélation positive (ça veut dire que lorsqu’une valeur augmente, l’autre aussi.. c’est ce qu’on a içi), et proche de -1 s’il y a une corrélation négative (exemple : nombre de bonbons dans un paquet de Haribo, et nombre de bonbons dans le ventre de la personne qui tient le paquet).

Voilà, j’ai fini, vous savez maintenant ce qu’est une généralité.

On récapitule?

On a vu trois cas de figure:

* Cas 1: Je cherche à comparer deux groupes, et il est possible de faire des cloches avec ce que je cherche à comparer (=les données que je veux comparer sont numériques). Dans ce cas je peux faire un graphique avec les cloches pour voir si elles se superposent. Je peux aussi calculer les moyennes et regarder si elles sont différentes.

* Cas 2: Je cherche à comparer deux groupes, et il n’est pas possible de faire des cloches avec ce que je cherche à comparer (=les données que je veux comparer ne sont pas numérique, ce sont aussi des groupes). Dans ce cas, je fais un tableau avec les effectifs. Avant de faire une généralité, je vérifie que j’ai pas loupé une information. Je peux calculer les proportions et regarder si elles sont différentes.

* Cas 3: Je ne cherche pas à comparer deux groupes (enfin si, ceux qui ont des grandes mains, et ceux qui ont des petites mains, si on veut, mais le contour de ces groupes est trop flou pour classer les gens dedans). Dans ce cas, je peux faire un nuage de points. Je peux aussi calculer la corrélation et voir si elle est positive, négative, ou nulle.

Voici grosso modo les 3 cas de figure où on fait le plus souvent des généralités (ie les X sont plus / sont moins ceci cela que les Y). C’est très simplifié, mais ça devrait déjà éclairer pas mal de choses dans les anecdotes du quotidien…

A bientôt pour le prochain épisode!

Prochain épisode : Quand peut-on ou ne peut-on pas faire de généralités?

Si je dis « moi, je connais untel qui devient tout rouge et gonflé si jamais il mange de la fraise.. donc la fraise c’est mauvais pour la santé », vous allez me répondre « nan, mais ton untel, il doit être allergique, c’est tout : ne fait pas de ton cas une généralité« .

Et vous auriez bien raison! Doit-on étudier tout le monde entier pour faire une généralité? Sinon, à partir de combien de cas peut-on faire une généralité? Quoi d’autre pourrait bien m’interdire de faire des généralités?

Pour la route…

Si vous sautillez d’impatience et ne pouvez plus tenir (non je ne me fait pas trop d’illusions, mais laissez moi rêver), un petit exercice pour la route. Suite à un fait divers (un délinquant à brûlé une voiture, et c’est une récidive, il avait déjà été arrêté et incarcéré pour le même motif auparavant), un journal publie un chiffre effarant : 66% des brûleurs de voiture sont des récidivistes. Ce chiffre suffit-il pour conclure que décidement, il ne faut que des peines « à vie» car « la récidive, ça suffit bon sang» ?

Réponse dans Stats #3 Feedback

Article originellement publié le 27 juil. 2014 et republié le 07 mars 2018 suite à migration du site.

Stats

Stats #1 Qu’est-ce qu’une généralité?

Parfois, je dis une généralité.  Par exemple: « les allemands sont plus grands que les français ».
Et là, il y a toujours un gars ou une fille pour me sortir : ah mais non, moi je connais untel, il est allemand, et il est plus petit que moi, qui suis français-e. C’est à ce garçon ou cette fille qu’est dédicacé ce post.

notallmen
Je dédicace également ce post aux hommes qui répondent « quoi? pas moi » (#notallmen) aux généralités sur la masculinité toxique. Bisous 😉

Lorsque je vous dis : les allemands sont plus grands que les français, c’est une généralité. Je n’ai jamais vérifié que cette généralité était vraie.

Pour vérifier si c’est vrai, première question : si j’avais des ‘données’, a quoi ressembleraient-elle ?

Réponse : j’aurais une liste d’individus (disons 2000 individus pris au hasard, numérotés hein, je fais pas de fichage), et pour chaque individu j’aurais deux informations : sa nationalité, et sa taille.

Individu Nationalité Taille (cm)
1 Français 167
2 Francais 180
3 Allemand 185
4 Français 171
5 Allemand 170
6 Allemand 175
etc etc etc

Jusque là, ça va.

Alors, combien de français sont grands ? Combien d’allemands ? C’est quoi grand ? Je vais faire des groupes de taille (des ‘classes’) et compter le nombre de personnes dans chacun de ces groupes, « pour voir ».

FigOk

Ce qui saute aux yeux quand je représente le nombre de personnes dans chaque groupe, c’est cette forme de cloche que ça dessine. Si je calculais la moyenne, elle tomberait grosso modo au niveau du sommet de la cloche. Et ce que je vois, c’est que même si chaque cloche a son sommet, ce qui signifie qu’en moyenne, oui, les allemands sont plus grands que les français, et bien ça n’empêche pas qu’il y ait des allemands dans le groupe « 1m68-1m69 » et des français qui soient plus grands, par exemple dans le groupe « 1m79-1m80 » !

On parle de « recouvrement des données ». C’est lié au fait que dans les groupes que l’on compare, il y a de la variabilité: les données sont « étalées » dans la largeur (plus les données sont étalées, plus la cloche est large). Les exceptions à la règle « les allemands sont plus grands que les français » sont les individus qui se trouvent dans la zone de recouvrement. S’il n’y avait pas de recouvrement, on pourrait dire que « tous les allemands sont plus grands que les français ». Mais il y a recouvrement, donc on ne peut pas dire cela.

En réalité, au quotidien, lorsque l’on fait des statistiques et que l’on compare deux groupes de données, il y a toujours recouvrement.

C’est pour cela que moi, avec ce genre de données je pourrais dire : « Les allemands sont plus grands que les français». C’est une généralité, et elle n’implique (dans ma tête en tous cas) rien de plus que cela: « En moyenne, les allemands sont plus grands que les français». Ou plus passe-partout: « En général, les allemands sont plus grands que les français ». Lorsque je dis cela, je ne sous-entend en aucun cas que tous les allemands seraient plus grands que les français, car je sais bien qu’il y a toujours recouvrement.

Attention. Parfois, le recouvrement est tel qu’on ne voit plus deux cloches, mais seulement une. Et dans ce cas là, on ne peut plus faire de généralité…

NB: les données et conclusions présentés içi sont 100% factices. Les données ont été simulées dans un but pédagogique.

Article originellement publié le 27 juil. 2014 et republié le 07 mars 2018 suite à migration du site.