Critères de dispersion

Après avoir déterminé où se situent les valeurs du caractère statistique en cherchant des critères de position, on peut chercher à déterminer la dispersion de ces valeurs.


Catégories :

Mathématiques élémentaires - Statistique descriptive - Métrologie

Icone math élém.jpg
Cet article est membre de la série
Mathématiques élémentaires
Algèbre
Logique
Arithmétique
Probabilités
Statistiques

Après avoir déterminé où se situent les valeurs du caractère statistique en cherchant des critères de position, on peut chercher à déterminer la dispersion de ces valeurs.

En mesure physique (métrologie), cette dispersion est estimée par l'écart type, qui permet de calculer l'erreur de mesure. De manière plus générale, il est important de savoir si les valeurs sont groupées ou au contraire dispersées, ce qui indique si la population est uniforme ou pas vis-à-vis du critère testé.

Étendue

L'étendue est la différence entre la valeur maximale et la valeur minimale du caractère statistique.

étendue =xmaxxmin

Écart interquartile

L'écart interquartile est la différence entre le troisième et le premier quartile.

écart interquartile = Q3 − Q1

L'écart interquartile correspond à l'étendue de la série statistique après élimination de 25% des valeurs les plus faibles et de 25% des valeurs les plus fortes. Cette mesure est plus robuste que l'étendue, qui est sensible aux valeurs extrêmes.

Dispersion autour de la moyenne

Après avoir calculé la moyenne, \bar x, on peut chercher à savoir de quelle façon les valeurs s'éloignent de cette moyenne. On crée alors une nouvelle série statistique : la série des écarts.

e_i=x_i-\bar x

Écart moyen

Le premier réflexe serait de calculer la moyenne de ces écarts. Mais les propriétés de la moyenne nous assurent que la moyenne des écarts est nulle. En effet, certains de ces écarts sont négatifs et d'autres sont positifs, la somme des écarts positifs compensant précisément la somme des écarts négatifs. Il faut par conséquent s'abstraire du signe et calculer alors la moyenne de la valeur absolue des écarts. C'est ce qu'on nomme l'écart moyen.

Variance

L'utilisation des valeurs absolues est fréquemment une impasse en mathématique (parce que la fonction valeur absolue n'est pas dérivable). Pour rendre positifs les écarts, un autre outil est à notre disposition : la mise au carré. On ne va par conséquent pas calculer la moyenne des écarts mais la moyenne des écarts au carré. C'est ce qu'on nomme la variance :

La disparition des valeurs absolues permet des calculs plus simples. On démontre que la variance peut se calculer plus simplement par les formules suivantes :

Ces formules étaient en particulier utiles dans le cadre de calculs à la main ; l'usage des ordinateurs les rend légèrement obsolètes...

Écart type

De par la mise au carré des écarts, l'unité de la variance est le carré de celle du caractère (si le caractère est en kg, sa moyenne est en kg mais sa variance est en kg2) d'où l'impossibilité d'additionner la moyenne et la variance. On a par conséquent défini l'écart type noté σ. L'écart type est la racine de la variance (et par conséquent son unité est la même que celle de la moyenne. Cela a l'air anecdotique mais la possibilité d'additionner moyenne et écart type est principale, surtout pour le calcul d'intervalle de confiance (voir plus bas).

Propriétés de l'écart type

Écart type relatif

Pour comparer deux séries statistiques qui n'ont pas le même ordre de grandeur, il est quelquefois bon de comparer l'écart type et la moyenne en faisant le quotient, on obtient alors l'écart type relatif. \sigma / \overline{x}.

Remarque : l'écart type relatif est aussi nommé cœfficient de variation.

Intervalle de confiance ou plage de normalité

Quand le caractère statistique a une distribution normale gaussienne, grossièrement en forme de cloche, l'écart type prend tout son sens.

On nomme ces intervalles les plages de normalité à niveau de confiance de 68%, 95%, 99, 7%. Voir la règle 68-95-99, 7   (en) .

Diamètres d'ordre r

Quand on dispose d'un ensemble de points (Mi) i = 1, ..., n dans le plan (par exemple), on peut mesurer la dispersion des points en utilisant les distances di, j entre les couples de points différents. On nomme alors diamètre d'ordre r (ou r est un réel non nul) le cœfficient D_r=\left(\frac2{n(n-1)}\sum_{i<j}d_{i,j}ˆr\right)ˆ\frac1r. Le diamètre d'ordre 0 est défini comme la limite, quand les di, j sont tous non nuls, de Dr, pour r tendant vers 0. Nicolas Gauvrit et Jean-Paul Delahaye ont montré que la meilleure valeur envisageable (parmi les diamètres d'ordre r) pour capturer la notion intuitive de dispersion est le diamètre d'ordre 0 : c'est celle qui correspond le mieux à ce que répondent des sujets adultes à qui on demande des estimations de dispersion[1].

Question de minimum

La médiane est la valeur qui rend minimum la fonction f définie par

La moyenne est la valeur qui rend minimum la fonction g définie par

Notes et références

  1. Gauvrit, N., & Delahaye, J. -P. (2006) Le diamètre d'ordre 0, une mesure naturelle d'étalement, Mathematiques et sciences humaines, 175, 41-51. [1]

Voir aussi

Recherche sur Google Images :



"Cet article est membre de la"

L'image ci-contre est extraite du site statelem.com

Il est possible que cette image soit réduite par rapport à l'originale. Elle est peut-être protégée par des droits d'auteur.

Voir l'image en taille réelle (170 × 80 - 6 ko - jpg)

Refaire la recherche sur Google Images

Recherche sur Amazone (livres) :



Principaux mots-clés de cette page : écart - série - valeurs - moyenne - statistiques - discrète - variance - ordre - dispersion - intervalle - diamètres - caractère - calculer - étendue - triée - regroupée - calculs - constante - mesure - population - interquartile - positifs - conséquent - absolue - nomme - carré - continue -

Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Crit%C3%A8res_de_dispersion.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 11/11/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu