12 janv. 2006

Détecter une valeur aberrante, le test de Dixon.

Voilà, vous avez votre série de mesures, vous allez pouvoir calculer moyenne et écart-type, mais en y regardant de plus près, un doute vous saisi. Cette valeur n'est elle pas anormalement haute (ou basse), devez-vous en tenir compte ? Il existe une réponse rigoureuse à cette question ; le test de Dixon.

Soient n ( supérieur ou égal à 3) valeurs x d'une mesure. Classons les par ordre croissant.

La question est donc de savoir si x1 ou xn est une valeur aberrante. Pour cela nous allons calculer les rapports suivant :

Si n est compris entre 3 et 7 alors rmin=(x2-x1)/(xn-x1) et rmax=(xn-xn-1)/(xn-x1).

Si n est compris entre 8 et 10 alors rmin=(x2-x1)/(x3-x1) et rmax=(xn-xn-1)/(xn-x2).

Si n est compris entre 11 et 13 alors rmin=(x3-x1)/(xn-1-x1) et rmax=(xn-xn-2)/(xn-x2).

Si n est compris entre 14 et 20 alors rmin=(x3-x1)/(xn-2-x1) et rmax=(xn-xn-2)/(xn-x3).

Le rapport rmin permet de tester la valeur x minimale alors que rmax sert à tester la valeur x maximum.



On compare ensuite la valeur de r obtenue à celle présente dans la table de Dixon. Si la valeurs de r est inférieure à la valeur de la table, au seuil donné, on ne peut éliminer l'observation. Comme vous avez décidément de la chance aujourd'hui, un classeur Excel qui automatise ce processus existe !


Il suffit de rentrer les valeurs dans un ordre croissant en commençant par la cellule C6 et de regarder la résultat. Pour l'instant, il n'est pas en ligne aussi cliquez ici (ôtez ANTI_SPAM de l'adresse) pour me le demander par mail. Il est gratuit (mais vous avez le droit de cliquer sur la pub).

Par contre, je ne sais pas si la table de Dixon existe pour un nombre de mesures supérieur à 20. Si quelqu'un à une réponse, je suis preneur.

Aucun commentaire: