Différence entre écart-type et erreur-type Différence entre

Anonim

Introduction

Standard D éviction (SD) et S standard > E rror (SE) sont des terminologies apparemment similaires; cependant, ils sont conceptuellement si variés qu'ils sont utilisés de façon presque interchangeable dans la littérature statistique. Les deux termes sont généralement précédés d'un symbole plus-moins (+/-) qui indique qu'ils définissent une valeur symétrique ou représentent une plage de valeurs. Invariablement, les deux termes apparaissent avec une moyenne (moyenne) d'un ensemble de valeurs mesurées.

Fait intéressant, une SE n'a rien à voir avec des normes, avec des erreurs, ou avec la communication de données scientifiques.

Un examen détaillé de l'origine et de l'explication de SD et SE révélera pourquoi les statisticiens professionnels et ceux qui s'en servent tout le temps ont tendance à se tromper.

Écart-type (SD)

Un écart-type est une statistique

descriptive décrivant la propagation d'une distribution. En tant que métrique, il est utile lorsque les données sont distribuées normalement. Cependant, il est moins utile lorsque les données sont très asymétriques ou bimodales car elles ne décrivent pas très bien la forme de la distribution. En général, nous utilisons SD pour signaler les caractéristiques de l'échantillon, parce que nous avons l'intention de décrire combien les données varient autour de la moyenne. D'autres statistiques utiles pour décrire la propagation des données sont l'intervalle interquartile, les 25e et 75e percentiles et la gamme des données.

Figure 1. SD est une mesure de la propagation des données. Lorsque les données sont un échantillon provenant d'une distribution normalement distribuée, on s'attend à ce que les deux tiers des données se situent à moins d'un écart-type de la moyenne.

La variance est également une statistique

descriptive , définie comme le carré de l'écart-type. Il n'est généralement pas rapporté lors de la description des résultats, mais il s'agit d'une formule mathématiquement plus traitable (a, k, a, la somme des écarts au carré) et joue un rôle dans le calcul des statistiques.

Par exemple, si nous avons deux statistiques

P & Q avec des variances connues var (P) & < var (Q) , alors la variance de la somme P + Q est égale à la somme des variances: var (P) + > var (Q) . Il est maintenant évident que les statisticiens aiment parler de variances. Mais les écarts-types ont une signification importante pour la propagation, en particulier lorsque les données sont distribuées normalement: On peut s'attendre à ce que la moyenne +/- 1 SD capture 2/3 de l'échantillon, et l'intervalle on peut s'attendre à ce que la moyenne

+ - 2 SD capture 95% de l'échantillon. SD fournit une indication de la mesure dans laquelle les réponses individuelles à une question varient ou «dévient» de la moyenne.SD explique au chercheur à quel point les réponses sont dispersées - sont-elles concentrées autour de la moyenne, ou dispersées loin et large? Est-ce que tous vos répondants ont évalué votre produit au milieu de votre échelle, ou est-ce que certains l'ont approuvé et d'autres l'ont désapprouvé? Considérez une expérience où les répondants sont invités à évaluer un produit sur une série d'attributs sur une échelle de 5 points. La moyenne pour un groupe de dix répondants (étiquetés «A» à «J» ci-dessous) pour «bon rapport qualité-prix» était de 3,2 avec un écart-type de 0,4 et la moyenne pour la «fiabilité du produit» était de 3. avec un écart-type de 2. 1. À première vue (en regardant uniquement les moyennes), il semblerait que la fiabilité soit supérieure à la valeur. Mais l'écart-type plus élevé pour la fiabilité pourrait indiquer (comme indiqué dans la distribution ci-dessous) que les réponses étaient très polarisées, la plupart des répondants n'ayant aucun problème de fiabilité (un attribut «5»), mais un segment plus petit, mais important. un problème de fiabilité et évalué l'attribut "1". En regardant le seul moyen ne dit qu'une partie de l'histoire, cependant, plus souvent qu'autrement, c'est ce sur quoi les chercheurs se concentrent. La distribution des réponses est importante à prendre en compte et le DS fournit une mesure descriptive précieuse à cet égard.

Répondant

Bon rapport qualité-prix

Fiabilité du produit

A 3 1
B 3 1
C 3 < 1 D
3 1 E
4 5 F
4 5 G
3 5 H
3 5 I
3 5 J
3 5 Moyenne
3. 2 3. 4 Std. Dev.
0. 4 2. 1 Première enquête: Les répondants évaluent un produit sur une échelle de 5 points
Deux distributions très différentes des réponses à une échelle d'évaluation à 5 points peuvent donner la même moyenne. Considérez l'exemple suivant montrant les valeurs de réponse pour deux évaluations différentes. Dans le premier exemple (note "A"), SD est zéro car TOUTES les réponses étaient exactement la valeur moyenne. Les réponses individuelles ne s'écartaient pas du tout de la moyenne. Dans la note «B», même si la moyenne du groupe est la même (3. 0) que la première distribution, l'écart-type est plus élevé. L'écart-type de 1,15 montre que les réponses individuelles, en moyenne *, se situaient à un peu plus d'un point de la moyenne.

Répondant

Notation "A"

Notation "B"

A

3 1 B
3 2 C
3 2 D
3 3 E
3 3 F
3 3 G
3 > 3 H 3
4 I 3
4 J 3
5 Moyenne 3. 0
3. 0 Std. Dev. 0. 00
1. 15 Deuxième enquête: Les répondants évaluent un produit sur une échelle de 5 points Une autre façon de considérer le DD est de tracer la distribution sous la forme d'un histogramme des réponses. Une distribution avec un faible écart-type se présenterait comme une forme haute et étroite, alors qu'un grand écart-type serait indiqué par une forme plus large.
SD n'indique généralement pas «bon ou mauvais» ou «meilleur ou pire» - un écart-type inférieur n'est pas nécessairement plus souhaitable. Il est utilisé uniquement comme une statistique descriptive. Il décrit la distribution par rapport à la moyenne. T avertissement technique relatif à SD

Considérer le DD comme un «écart moyen» est un excellent moyen de comprendre conceptuellement sa signification. Cependant, il n'est pas réellement calculé comme une moyenne (si c'était le cas, nous l'appellerions «l'écart moyen»). Au lieu de cela, il est "standardisé", une méthode assez complexe de calculer la valeur en utilisant la somme des carrés.

Pour des raisons pratiques, le calcul n'est pas important. La plupart des programmes de tabulation, tableurs ou autres outils de gestion de données calculeront le DD pour vous. Plus important est de comprendre ce que les statistiques véhiculent.

Erreur standard

Une erreur standard est une statistique inférentielle

utilisée pour comparer les moyennes (moyennes) d'un échantillon à l'autre des populations. C'est une mesure de

précision

de la moyenne de l'échantillon. La moyenne de l'échantillon est une statistique dérivée de données ayant une distribution sous-jacente. Nous ne pouvons pas le visualiser de la même manière que les données, puisque nous avons effectué une seule expérience et n'avons qu'une seule valeur. La théorie statistique nous dit que la moyenne de l'échantillon (pour un grand échantillon «suffisant» et dans quelques conditions de régularité) est approximativement distribuée normalement. L'écart-type de cette distribution normale est ce que nous appelons l'erreur-type.

Figure 2. La répartition en bas indique la distribution des données, tandis que la distribution en haut représente la distribution théorique de la moyenne de l'échantillon. L'écart-type de 20 est une mesure de la propagation des données, tandis que l'erreur-type de 5 est une mesure de l'incertitude autour de la moyenne de l'échantillon. Lorsque nous voulons comparer les moyennes des résultats d'une expérience à deux échantillons du traitement A et du traitement B, nous devons estimer avec quelle précision nous avons mesuré les moyennes. En fait, nous nous intéressons à la précision avec laquelle nous avons mesuré la différence entre les deux moyens. Nous appelons cette mesure l'erreur standard de la différence. Vous ne serez peut-être pas surpris d'apprendre que l'erreur-type de la différence dans les moyennes de l'échantillon est fonction des erreurs-types des moyennes:

Maintenant que vous avez compris que l'erreur-type de la moyenne (SE) et de la écart-type de la distribution (SD) sont deux bêtes différentes, vous demandez peut-être comment ils se sont trompés en premier lieu. Bien qu'ils diffèrent conceptuellement, ils ont une relation simple mathématiquement: , où n est le nombre de points de données. Notez que l'erreur-type dépend de deux composantes: l'écart-type de l'échantillon et la taille de l'échantillon

n

. Cela a un sens intuitif: plus l'écart type de l'échantillon est grand, moins nous pouvons être précis sur notre estimation de la moyenne vraie.

De plus, plus la taille de l'échantillon est grande, plus nous avons d'informations sur la population et plus nous pouvons estimer la vraie moyenne.

SE est une indication de la fiabilité de la moyenne. Une petite SE est une indication que la moyenne de l'échantillon reflète mieux la moyenne réelle de la population.Une taille d'échantillon plus grande se traduira normalement par un plus petit SE (tandis que SD n'est pas directement affecté par la taille de l'échantillon).

La plupart des enquêtes consistent à prélever un échantillon dans une population. Nous faisons ensuite des inférences sur la population à partir des résultats obtenus à partir de cet échantillon. Si un deuxième échantillon a été tiré, les résultats ne correspondront probablement pas exactement au premier échantillon. Si la valeur moyenne d'un attribut de notation était de 3. 2 pour un échantillon, elle pourrait être de 3. 4 pour un deuxième échantillon de même taille. Si nous devions tirer un nombre infini d'échantillons (de taille égale) de notre population, nous pourrions afficher les moyennes observées comme une distribution. Nous pourrions ensuite calculer une moyenne de tous nos moyens d'échantillonnage. Cette moyenne équivaudrait à la moyenne de la population réelle. Nous pouvons également calculer l'écart-type de la distribution des moyennes d'échantillons. L'écart-type de cette distribution des moyennes d'échantillon est l'écart-type de chaque moyenne d'échantillon individuel. Nous avons donc notre observation la plus significative: SE est le SD de la population moyenne.

Échantillon

Moyenne

1er

3. 2 2ème

3. 4 3e
3. 3 4e
3. 2 5e
3. 1 ….
…. ….
…. ….
…. ….
…. ….
…. Moyenne
3. 3 Std. Dev.
0. 13 Tableau illustrant la relation entre SD et SE
Il est maintenant clair que si l'écart-type de cette distribution nous aide à comprendre à quel point un échantillon est moyen par rapport à la moyenne réelle, nous pouvons l'utiliser pour comprendre comment précis chaque échantillon individuel est en relation avec la moyenne vraie. C'est l'essence de SE. En réalité, nous n'avons prélevé qu'un seul échantillon de notre population, mais nous pouvons utiliser ce résultat pour fournir une estimation de la fiabilité de la moyenne de notre échantillon observé.
En fait, SE nous dit que nous pouvons avoir 95% de confiance que la moyenne de notre échantillon observé est de plus ou moins 2 (en fait 1. 96). Le tableau ci-dessous montre la distribution des réponses de notre premier (et unique) échantillon utilisé pour notre recherche. Le SE de 0,13, étant relativement petit, nous donne une indication que notre moyenne est relativement proche de la vraie moyenne de notre population globale. La marge d'erreur (à 95% de confiance) pour notre moyenne est (approximativement) le double de cette valeur (+/- 0,26), nous indiquant que la vraie moyenne est probablement entre 2, 94 et 3. 46.

Répondant

Evaluation

A

3

B

3
C 3
D 3
E 4
F 4
G 3
H 3
I 3
J 3
Moyenne > 3. 2 Std. Err
0. 13
Résumé De nombreux chercheurs ne comprennent pas la distinction entre écart-type et erreur-type, même s'ils sont couramment inclus dans l'analyse des données. Bien que les calculs réels pour l'écart-type et l'erreur-type soient très similaires, ils représentent deux mesures très différentes, mais complémentaires. SD nous indique la forme de notre distribution, à quel point les valeurs de données individuelles sont proches de la valeur moyenne. SE nous dit à quel point notre échantillon est proche de la moyenne de la population totale.Ensemble, ils aident à fournir une image plus complète que le seul moyen peut nous dire.