Différence entre la moyenne, la médiane et le mode

Anonim

Moyenne, médiane et mode sont les principales mesures de tendance centrale utilisées dans les statistiques descriptives. Ils sont complètement différents les uns des autres et les cas dans lesquels ils sont utilisés pour résumer les données sont également différents.

Moyenne

La moyenne arithmétique est la somme des valeurs de données divisées par le nombre de valeurs de données, i. e.

Si les données proviennent d'un espace échantillon, cela s'appelle une moyenne d'échantillon (

), qui est une statistique descriptive de l'échantillon. Bien que ce soit la mesure descriptive la plus couramment utilisée pour un échantillon, ce n'est pas une statistique robuste. Il est très sensible aux valeurs aberrantes et aux oscillations.

Par exemple, considérons le revenu moyen des citoyens d'une ville donnée. Puisque toutes les valeurs de données sont additionnées puis divisées, le revenu d'une personne extrêmement riche affecte significativement la moyenne. Par conséquent, les valeurs moyennes ne sont pas toujours une bonne représentation des données.

De plus, dans le cas d'un signal alternatif, le courant traversant un élément varie périodiquement de la direction positive à la direction négative et vice versa. Si nous prenons le courant moyen passant par l'élément en une seule période, il donnera un 0, ce qui signifie qu'aucun courant n'a traversé l'élément, ce qui n'est évidemment pas vrai. Par conséquent, dans ce cas aussi, la moyenne arithmétique n'est pas une bonne mesure.

La moyenne arithmétique est un bon indicateur lorsque les données sont uniformément distribuées. Pour une distribution normale, la moyenne est égale au mode et à la médiane. Il a également les résidus les plus bas en considérant l'erreur quadratique moyenne. par conséquent, la meilleure mesure descriptive quand il est nécessaire de représenter un ensemble de données par un seul numéro.

Médiane

Les valeurs du point de données intermédiaire après avoir organisé toutes les valeurs de données par ordre croissant sont définies comme la médiane de l'ensemble de données. La médiane est le 2e quartile, le 5e décile et le 50e percentile.

• Si le nombre d'observations (points de données) est impair, la médiane est l'observation exactement au milieu de la liste ordonnée.

• Si le nombre d'observations (points de données) est pair, la médiane est la moyenne des deux observations moyennes de la liste ordonnée.

La médiane divise l'observation en deux groupes; je. e. un groupe (50%) de valeurs supérieures et un groupe (50%) de valeurs inférieures à la médiane. Les médianes sont spécifiquement utilisées dans les distributions asymétriques et représentent des données relativement meilleures que la moyenne arithmétique.

Mode

Le mode est le nombre le plus important dans un ensemble d'observations.Le mode d'un ensemble de données est calculé en trouvant la fréquence de chaque élément dans l'ensemble.

• Si aucune valeur ne se produit plus d'une fois, l'ensemble de données n'a pas de mode.

• Sinon, toute valeur qui se produit avec la plus grande fréquence est un mode du jeu de données.

Plus d'un mode peut exister dans un ensemble; Par conséquent, le mode n'est pas une statistique unique d'un ensemble de données. Dans une distribution uniforme, il y a un mode. Le mode d'une distribution de probabilité discrète est le point où la fonction de masse de probabilité atteint son point le plus élevé. Rendu à partir des interprétations ci-dessus, on peut dire que maxima globaux sont des modes.

Envisager l'application des trois mesures à l'ensemble de données suivant.

DONNÉES: 1, 2, 3, 5, 5, 5, 6, 8, 8, 9, 9, 9, 9, 10, 10, 15, 15, 15}

Moyenne = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ Mode = 9 (fréquence de 9 = 5)

Quelle est la différence entre la moyenne, la médiane? et Mode?

• La moyenne arithmétique est la somme des valeurs (observations) divisées par le nombre d'observations. Ce n'est pas une statistique robuste, et dépend fortement de la nature normale de distribution dans la distribution considérée. Une seule valeur aberrante peut entraîner un changement significatif de la moyenne avec des valeurs relativement trompeuses. Le concept peut être étendu à la moyenne géométrique, à la moyenne harmonique, à la moyenne pondérée, etc.

• La médiane est la valeur moyenne de l'ensemble des observations et est relativement moins affectée par les valeurs aberrantes. Il peut donner une bonne estimation en tant que statistique sommaire dans les cas fortement asymétriques.

• Le mode est la valeur d'observation la plus courante dans l'ensemble de données. Si la distribution est asymétrique positive, le mode est laissé à la médiane et, en cas de biais négatif, le mode se situe juste à la médiane.

• En cas de biais positif, la moyenne se situe à droite de la médiane; si la moyenne négative est à gauche de la médiane.

• Dans la distribution normale, les trois, moyenne, mode et médiane sont égaux.