Parfois, je dis une généralité. Par exemple: « les allemands sont plus grands que les français ».
Et là, il y a toujours un gars ou une fille pour me sortir : ah mais non, moi je connais untel, il est allemand, et il est plus petit que moi, qui suis français-e. C’est à ce garçon ou cette fille qu’est dédicacé ce post.

Lorsque je vous dis : les allemands sont plus grands que les français, c’est une généralité. Je n’ai jamais vérifié que cette généralité était vraie.
Pour vérifier si c’est vrai, première question : si j’avais des ‘données’, a quoi ressembleraient-elle ?
Réponse : j’aurais une liste d’individus (disons 2000 individus pris au hasard, numérotés hein, je fais pas de fichage), et pour chaque individu j’aurais deux informations : sa nationalité, et sa taille.
Individu | Nationalité | Taille (cm) |
1 | Français | 167 |
2 | Francais | 180 |
3 | Allemand | 185 |
4 | Français | 171 |
5 | Allemand | 170 |
6 | Allemand | 175 |
etc | etc | etc |
Jusque là, ça va.
Alors, combien de français sont grands ? Combien d’allemands ? C’est quoi grand ? Je vais faire des groupes de taille (des ‘classes’) et compter le nombre de personnes dans chacun de ces groupes, « pour voir ».
Ce qui saute aux yeux quand je représente le nombre de personnes dans chaque groupe, c’est cette forme de cloche que ça dessine. Si je calculais la moyenne, elle tomberait grosso modo au niveau du sommet de la cloche. Et ce que je vois, c’est que même si chaque cloche a son sommet, ce qui signifie qu’en moyenne, oui, les allemands sont plus grands que les français, et bien ça n’empêche pas qu’il y ait des allemands dans le groupe « 1m68-1m69 » et des français qui soient plus grands, par exemple dans le groupe « 1m79-1m80 » !
On parle de « recouvrement des données ». C’est lié au fait que dans les groupes que l’on compare, il y a de la variabilité: les données sont « étalées » dans la largeur (plus les données sont étalées, plus la cloche est large). Les exceptions à la règle « les allemands sont plus grands que les français » sont les individus qui se trouvent dans la zone de recouvrement. S’il n’y avait pas de recouvrement, on pourrait dire que « tous les allemands sont plus grands que les français ». Mais il y a recouvrement, donc on ne peut pas dire cela.
En réalité, au quotidien, lorsque l’on fait des statistiques et que l’on compare deux groupes de données, il y a toujours recouvrement.
C’est pour cela que moi, avec ce genre de données je pourrais dire : « Les allemands sont plus grands que les français». C’est une généralité, et elle n’implique (dans ma tête en tous cas) rien de plus que cela: « En moyenne, les allemands sont plus grands que les français». Ou plus passe-partout: « En général, les allemands sont plus grands que les français ». Lorsque je dis cela, je ne sous-entend en aucun cas que tous les allemands seraient plus grands que les français, car je sais bien qu’il y a toujours recouvrement.
Attention. Parfois, le recouvrement est tel qu’on ne voit plus deux cloches, mais seulement une. Et dans ce cas là, on ne peut plus faire de généralité…
NB: les données et conclusions présentés içi sont 100% factices. Les données ont été simulées dans un but pédagogique.
Article originellement publié le 27 juil. 2014 et republié le 07 mars 2018 suite à migration du site.
2 réflexions au sujet de “Stats #1 Qu’est-ce qu’une généralité?”