Ce tweet a retenu mon attention (en effet, on a un problème) :
La médiane détermine une valeur prise par le caractère étudié (ici l’âge) qui permet de partager une série en deux sous-séries de même effectif. Si on caricature, c’est la “valeur du milieu”, sauf que non, s’il y a répétition ou s’il y a un nombre pair de valeurs et que les valeurs sont toutes différentes.
Par exemple:
- 1 ; 2 ; 3 ; 4 ; 5 a pour médiane 3. Il y a deux valeurs avant 3, deux valeurs après 3. Mais pour autant, plus de 50% des valeurs sont inférieures ou égales à 3, et pareil pour les valeurs supérieurs ou égales ;
- 1 ; 2 ; 3 ; 4 ; 5 ; 6 a pour médiane 3,5. Pourtant 3,5 n’est pas une valeur de la série, mais ce n’est pas grave. Dans ce cas, on a bien une répartition 50%-50% ;
- 1 ; 2 ; 3; 4 ; 50 000 ; 100 000 a aussi pour médiane 3,5. Comme au-dessus on a bien une répartition 50%-50%, mais la moyenne serait trèèèès différente de celle de la série précédente : la médiane dépend de la ou des valeurs centrales, pas des valeurs extrêmes ;
- 1 ; 2 ; 2 ; 2 ; 2 ; 2 ; 2 a une médiane de 2, et là, l’idée de 50% s’envole complètement, mais en même temps sur une série de ce type la médiane n’a aucun intérêt.
Si dans une population on a un âge médian de 17 ans, cela signifie donc qu’au moins 50% de la population a 17 ans. Peut-être plus (peut-être 100%, si on prend une population de personnes de 17 ans, ce qui serait tout à fait idiot). En revanche, si on classe les personnes de la plus jeune à la plus âgée et qu’on demande à ces personnes de se séparer en deux groupes de même effectif :
- Soit la personne qui reste toute seule au milieu sans savoir où aller (elle est la médiane, elle ne doit aller nulle part) a 17 ans
- Soit la personne la plus âgée du groupe jeune et la personne la plus jeune du groupe âgé ont une moyenne, à elles deux, de 17 ans.
Conclusion : ce qui est absolument certain, c’est que la moitié “plus jeune” du groupe complet a un âge inférieur ou égal à 17 ans. Et donc, il y a forcément 50% (ou plus) de personnes mineures.
Et 1/2 est supérieur à 1/3.
Prolongement rigolo à ce twett : ChatGPT et les stats…
