Critère de position

Les critères de position d'un ensemble sont quelques valeurs calculées caractérisant globalement la position de cet ensemble, par exemple sa moyenne, son mode, sa médiane, ou ses quantiles Dans le jargon mathématique belge, on les nomme aussi les valeurs centrales.


Catégories :

Mathématiques élémentaires - Statistique descriptive - Métrologie

Recherche sur Google Images :


Source image : climatheque.meteo.fr
Cette image est un résultat de recherche de Google Image. Elle est peut-être réduite par rapport à l'originale et/ou protégée par des droits d'auteur.

Page(s) en rapport avec ce sujet :

  • Il a été trouvé avantageux d'exprimer aussi le critère de déposition à l'aide.... la fonction de Shields peut présenter un critère pour la déposition aussi... (source : iahs)
  • ou acceptée, trois types de critères de base sont appliqués : i) un critère de position dominante (la fusion créera-t-elle ou renforcera-... (source : cairn)
Icone math élém.jpg
Cet article est membre de la série
Mathématiques élémentaires
Algèbre
Logique
Arithmétique
Probabilités
Statistiques

Les critères de position d'un ensemble (de valeurs numériques d'un caractère statistique donné) sont quelques valeurs calculées caractérisant globalement la position de cet ensemble, par exemple sa moyenne, son mode, sa médiane, ou ses quantiles (quartiles, déciles) Dans le jargon mathématique belge, on les nomme aussi les valeurs centrales.

En statistiques, on est généralement en présence de la plupart de valeurs. Or, si l'intégralité de ces valeurs forme l'information, il n'est pas aisé de manipuler plusieurs centaines voir milliers de chiffres, ni d'en tirer des conclusions. Il faut par conséquent calculer quelques valeurs qui vont permettre d'analyser les données.

En mesure physique (métrologie), on va généralement calculer deux valeurs : la moyenne, qui représentera la «valeur» de la mesure, et l'écart type, qui va estimer l'erreur de mesure. Dans d'autres domaines, on va vouloir avoir une description plus fine de la répartition des valeurs, et par conséquent calculer d'autres positions.

Valeur maximum et valeur minimum

La valeur maximale est la plus grande valeur prise par le caractère statistique.

La valeur minimale est la plus petite valeur prise par le caractère statistique.

Médiane

La médiane tend à partager la population en deux populations de taille égale. Si m est la médiane, le nombre d"individus dont le caractère statistique est inférieur à m doit correspondre au nombre d'individus dont le caractère statistique est supérieur à m. Si cette définition s'accorde bien avec le cas d'une variable continue, elle n'est pas adaptée au cas d'une variable discrète où une autre définition est donnée. Si les valeurs du caractère statistique sont toutes différentes, la médiane, telle qu'elle est définie dans le cas discret, partage bien la population en deux, mais ce n'est pas forcément le cas si certaines valeurs du caractère statistique sont prises plusieurs fois.

Cas de la variable discrète

On trie les valeurs par ordre croissant.

Exemple : série de 13 notes 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 16.
Médiane = M = 10
Exemple : série de 12 notes : 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 13, 16.
Médiane = M = 9, 5

Cas de la variable continue

On utilise le polygone des fréquences cumulées croissantes et le tableau correspondant et on détermine graphiquement ou par interpolation linéaire la valeur M pour laquelle la fréquence de l'intervalle [valeur min, M] vaut 50%.

Utilisation du polygone des fréquences cumulées croissantes

Dans l'exemple développé dans statistiques élémentaires continues, le polygone des fréquences cumulées est le suivant :

Polygone et mediane.png

La droite d'équation y = 50 coupe le polygone à peu près au point d'abscisse 21. M \approx 21.

Remarque : Le polygone des fréquences cumulées croissantes et celui des fréquences cumulées décroissantes se coupent précisément en un point dont l'abscisse est la médiane.

Utilisation du tableau des fréquences cumulées croissantes

Dans l'exemple précédent, le tableau des fréquences cumulées croissantes est :

xi 0 8 12 16 20 30 40 60
fréquences cumulées croissantes 0 7 12, 3 21, 1 48, 1 81, 7 94, 7 100

Les 50% sont atteint entre 20 et 30 par conséquent pour une valeur M qu'on estime à 20+10\dfrac{50-48,1}{81,7-48,1}= 20,56 par interpolation linéaire.

Moyenne

Cas de la série statistique discrète triée mais non regroupée

\overline{x}=\dfrac{1}{n}\sum_{i=1}ˆ{n}x_i

L'article Statistiques élémentaires discrètes explique cette formule.

Cas de la série statistique discrète regroupée

\overline{x}=\dfrac{\sum_{i=1}ˆ{N}n_ix_i}{\sum_{i=1}ˆNn_i}=\sum_{i=1}ˆNf_ix_i

L'article Statistiques élémentaires discrètes explique cette formule.

Cas de la série continue

*\overline{x}=\dfrac{\sum_{i=1}ˆ{N}n_im_i}{\sum_{i=1}ˆNn_i}=\sum_{i=1}ˆNf_im_i

L'article Statistiques élémentaires continues explique cette formule.

Stabilité par transformation affine

La moyenne est stable par transformation affine, c'est-à-dire : si yi = axi + b, si \overline{x} est la moyenne de la série x alors la moyenne de la série y est \overline{y} = a\overline{x}+b.

Cette propriété est utile pour changer d'unité : si on connaît une moyenne de température en degré Fahrenheit, il est inutile de convertir l'ensemble des valeurs en degrés Celsius pour calculer la moyenne en degrés Celsius, il suffit de ne convertir que la moyenne.

Il est aussi intéressant, pour limiter la taille des nombres, de partir d'un moyenne estimée et de calculer la moyenne des di = xiMestim. . Alors \overline{x} = M_{estim.} + \overline{d}

Découpage en sous-population

Si la population est découpée en deux sous-populations P1 et P2 de tailles n1 et n2, si la moyenne du caractère statistique pour la population P1 est \overline{x_1} et la moyenne pour la population P2 est \overline{x_2} alors la moyenne pour la population P est \overline{x} = \dfrac{n_1\overline{x_1}+n_2\overline{x_2}}{n_1+n_2}.

Sensibilité aux valeurs extrêmes

La moyenne est sensible aux valeurs extrêmes ou aberrantes.

Exemple : dans une entreprise, 9 salariés sont payés 2000 Euros mensuels. Le patron se paie 22000 Euros mensuels.

Effectuer la moyenne dans ces conditions conduit à une valeur non représentative : \overline{x}=\dfrac{9\times2000+22000}{10}=4000 Euros.

Pour éviter ce genre de piège, il arrive qu'on tronque volontairement la population et qu'on élimine 10% des valeurs les plus basses et 10% des valeurs les plus hautes.

Mode

Le mode est la valeur du caractère statistique qui apparaît généralement.

Exemple 1 : note des élèves
notes xi 5 8 9 10 11 12 13 14 16 Total
effectifs ni 1 1 2 4 3 2 1 1 1 16

Le mode est 10.

Exemple 2 : note des élèves
notes xi 5 8 9 10 11 12 13 14 16 Total
effectifs ni 1 1 4 2 2 4 1 1 1 16

Cette série est dite série bimodale car on voit naitre deux modes : 9 et 12.

Dans le cas d'une variable continue, on peut entendre parler de classe modale qui serait la classe de plus grand effectif. Mais il faut se méfier de cette notion car, plus la classe est de grande amplitude, plus son effectif est important sans pour tout autant que cela soit significatif. Cette notion de classe modale définie par les effectifs de la classe n'a de sens que si les classes ont même amplitude. Si les amplitudes sont différentes, il faut aller chercher sur l'histogramme la classe associée au rectangle de plus grande hauteur.

Exemple : l'exemple développé dans Statistiques élémentaires continues conduit au tableau suivant : Répartition des revenus annuels en milliers d'Euros dans une population de 4370 personnes.
Salaires entre 0 (inclus) et 8 exclus entre 8 (inclus) et 12 exclus entre 12 (inclus) et 16 exclus entre 16 (inclus) et 20 exclus entre 20 (inclus) et 30 exclus entre 30 (inclus) et 40 exclus entre 40 (inclus) et 60 exclus Total
Effectifs 306 231 385 1180 1468 568 232 4370

L'observation de ce tableau laisse penser que la classe modale serait la classe [20;30[. Mais une observation de l'histogramme corrige cette idée fausse :

La classe modale est la classe [16; 20[

Quartiles

Les quartiles sont les trois valeurs qui partagent la population en 4 sous-populations de même taille

Cas de la variable discrète

On range les valeurs par ordre croissant.

On détermine le second quartile qui correspond à la médiane. Puis on cherche la médiane de la première moitié de la population qui correspond au 1er quartile. On cherche la médiane de la seconde moitié de la population qui correspond au troisième quartile.

Si la population est de taille n, on distingue 4 cas.

Si n = 4p

Q1 = moyenne entre la pe et (p+1) e valeur.

Q2 = moyenne entre la (2p) e valeur et la (2p+1) e valeur.

Q3 = moyenne entre la (3p) e valeur et la (3p+1) e valeur.

Exemple : série de 12 notes : 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 13, 16

Q1 = 7, 5

Q2 = 9, 5

Q3 = 10, 5

Si n = 4p+1

Q1 = (p+1) e valeur.

Q2 = (2p+1) e valeur.

Q3 = (3p+1) e valeur.

Exemple : série de 13 notes 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 16

Q1 = 8

Q2 = 10

Q3 = 11

Si n = 4p+2

Q1 = (p+1) e valeur.

Q2 = moyenne entre la (2p+1) e valeur et la (2p+2) e valeur.

Q3 = (3p+2) e valeur.

Exemple : série de 14 notes 4, 5, 7, 8, 8, 9, 9, 10, 10, 10, 11, 12, 13, 16

Q1 = 8

Q2 = 9, 5

Q3 = 11

Si n = 4p+3

Q1 = (p+1) e valeur.

Q2 = (2p+2) e valeur.

Q3 = (3p+3) e valeur.

Exemple : série de 15 notes 4, 5, 7, 8, 8, 9, 9, 10, 10, 10, 11, 11, 12, 13, 16

Q1 = 8

Q2 = 10

Q3 = 11

Approximation utile pour une variable discrète

On range les valeurs par ordre croissant.

Q1 est la première valeur pour laquelle l'intervalle [x min, Q1] regroupe au moins 25% de la population.

Q2 est la première valeur pour laquelle l'intervalle [x min, Q2] regroupe au moins 50% de la population.

Q3 est la première valeur pour laquelle l'intervalle [x min, Q3] regroupe au moins 75% de la population.

En reprenant les exemples qui ont précédé :

Si n = 12 : 25% de n = 3, puis 50% de n = 6, puis 75% de n =9.

La série de notes est 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 13, 16

Q1 = 7, Q2 = 9, Q3 = 10

Si n = 13 : 25% de 13 = 3, 25, puis 50% de 13 = 6, 5, puis 75% de 13 = 9, 75 qu'on arrondit à l'entier supérieur.

La série de notes est 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 12, 13, 16

Q1 = 8, Q2 = 10, Q3 = 11

On s'aperçoit que cette approximation rend dissymétrique la définition, que le second quartile ne correspond plus à la médiane et que les valeurs obtenues changent de celles de la définition précédente. Son avantage est de rendre la recherche des quartiles (approchés) plus facile sans qu'on soit obligé de distinguer 4 cas. Les différences obtenues par l'une ou l'autre des méthodes se révèlent négligeables et justifient l'usage de cette approximation.

Cas de la variable continue

On calcule les quartiles comme la médiane, graphiquement grâce au polygone des fréquences cumulées croissantes, et par interpolation linéaire grâce au tableau correspondant.

Utilisation du polygone des fréquences cumulées croissantes

Polygone quartile.png

Les droites d'équation, y = 25, y = 50 et y = 75 coupent le polygone en des points dont les abscisses valent à peu près 17, 21, 28.

Utilisation du tableau des fréquences cumulées croissantes

Le tableau des fréquences cumulées croissantes est :

xi 0 8 12 16 20 30 40 60
fréquences cumulées croissantes 0 7 12, 3 21, 1 48, 1 81, 7 94, 7 100

25% est atteint dans l'intervalle [16;20] soit pour une valeur de Q1 obtenue par interpolation linéaire Q1 =16+4\dfrac{25-21,1}{48,1-21,1}=16,57.

Q2 =M =20, 56.

75% est atteint dans l'intervalle [20;30] soit pour une valeur de Q3 obtenue par interpolation linéaire Q3 =20+10\dfrac{75-48,1}{81,7-48,1}=28,00.

Déciles

Les déciles sont les 9 valeurs qui partagent la population en 10 sous-populations de même taille.

Cas de la variable discrète

On travaillera ici par approximation : le ne décile Dn est la première valeur du caractère tel que l'intervalle [xmin, Dn] regroupe au moins n dixième de la population.

Exemple Série de 30 notes, 9e décile = 27e valeur.

4, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 11, 11, 12, 12, 12, 13, 13, 14, 14, 15, 16

D9= 14

Cas de la variable continue

On calcule les déciles comme la médiane et les quartiles, graphiquement grâce au polygone des fréquences cumulées croissantes, et par interpolation linéaire grâce au tableau correspondant.

Utilisation du polygone des fréquences cumulées croissantes

Polygone decile.png

Les droites d'équation y = 10, y = 20... y = 90 coupent le polygone en des points dont les abscisses valent à peu près D1=10, 5, D2= 15, 5... D9=36, 5

Utilisation du tableau des fréquences cumulées croissantes

Le tableau des fréquences cumulées croissantes est :

xi 0 8 12 16 20 30 40 60
fréquences cumulées croissantes 0 7 12, 3 21, 1 48, 1 81, 7 94, 7 100

10% est atteint dans l'intervalle [8;12] soit pour une valeur de D1 obtenue par interpolation linéaire D_1 =8+4\dfrac{10-7}{12,3-7}=10,26.

20% est atteint dans l'intervalle [12, 16] soit pour une valeur de D2 obtenue par interpolation linéaire D_2 =12+4\dfrac{20-12,3}{21,1-12,3}=15,50.

90% est atteint dans l'intervalle [30;40] soit pour une valeur de D9 obtenue par interpolation linéaire D_9 = 30+10\dfrac{90-81,7}{94,7-81,7}=36,38.

Voir aussi

Recherche sur Amazone (livres) :



Principaux mots-clés de cette page : valeurs - population - statistiques - moyenne - fréquences - cumulées - série - médiane - croissantes - notes - caractère - polygone - tableau - classe - quartiles - variable - intervalle - continue - discrète - interpolation - linéaire - élémentaires - inclus - exclus - obtenues - déciles - taille - utilisation - atteint - effectifs -

Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Crit%C3%A8re_de_position.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 11/11/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu