Différence entre la variance de l'échantillon et la variance de la population Différence Entre

Anonim

Explication

En statistique, le terme échantillonnage se réfère à la sélection d'une partie des données statistiques agrégées dans le but d'obtenir des informations pertinentes sur l'ensemble. L'ensemble ou l'ensemble des informations statistiques sur un caractère particulier de tous les membres couverts par l'enquête est appelé «population» ou «univers». (Das, N. G., 2010). La partie sélectionnée de la population qui est utilisée pour obtenir les caractéristiques de la population ou de l'univers est appelée «échantillon». La population est considérée comme composée d'unités ou de membres individuels, et certaines unités sont incluses dans l'échantillon. Le nombre total d'unités de la population est appelé taille de la population, et celui de l'échantillon est appelé taille de l'échantillon. La population et l'échantillon peuvent être finis ou infinis et de même ils peuvent être existants ou hypothétiques.

Variance: La variance est une valeur numérique qui montre dans quelle mesure les chiffres individuels d'un ensemble de données se répartissent autour de la moyenne. C'est ainsi que chaque nombre est éloigné de la moyenne, et donc de l'autre. Une variance de valeur nulle signifie que toutes les données sont identiques. Plus la variance, plus sont les valeurs étalées sur la moyenne, donc les unes des autres. Moins la variance, moins sont les valeurs réparties sur la moyenne, donc de l'autre, et la variance ne peut pas être négative.

Différence entre la variance de la population et la variance de l'échantillon

La principale différence entre la variance de la population et la variance de l'échantillon est liée au calcul de la variance. La variance est calculée en cinq étapes. La première moyenne est calculée, puis nous calculons les écarts par rapport à la moyenne, et troisièmement, les écarts sont mis au carré, quatrièmement, les écarts au carré sont additionnés et finalement cette somme est divisée par le nombre d'items pour lesquels la variance est calculée. Donc variance = Σ (xi-x -) / n. Où xi = ith. Nombre, x- = moyenne et n = nombre d'éléments …

Maintenant, quand la variance doit être calculée à partir des données de population, n est égal au nombre d'items. Ainsi, si la variance de la pression artérielle de l'ensemble des 1000 personnes doit être calculée à partir des données sur la pression artérielle des 1000 personnes, alors n = 1000. Cependant, lorsque la variance est calculée à partir des données de l'échantillon, somme des écarts quadratiques. Ainsi, dans l'exemple ci-dessus, si les données de l'échantillon ont 100 items, le dénominateur serait 100 - 1 = 99.

Pour cette raison, la valeur de la variance calculée à partir des données de l'échantillon est supérieure à la valeur qui aurait pu être trouvée en utilisant les données de population. La logique de faire cela est de compenser notre manque d'information sur les données démographiques. Il est impossible de trouver la variance des hauteurs chez les êtres humains, pour notre manque absolu d'informations sur les hauteurs de tous les êtres vivants, et non pour parler de l'avenir.Même si nous prenons un exemple modéré, comme les données de population sur les tailles de tous les hommes vivants aux États-Unis, c'est physiquement possible, mais le coût et le temps impliqués dans ce cas irait à l'encontre de l'objectif de son calcul. C'est la raison pour laquelle les données d'échantillon sont prises pour la plupart des objectifs statistiques, et cela s'accompagne d'un manque d'informations sur la majorité des données. Pour compenser cela, la valeur de la variance et l'écart type, qui est la racine de la variance au carré, sont plus élevés dans le cas des données d'échantillon que dans la variance des données de la population.

Cela agit comme un bouclier automatique pour les analystes et les décideurs. La logique s'applique aux décisions sur la budgétisation des immobilisations, le financement des particuliers et des affaires, la construction, la gestion du trafic, et de nombreux domaines applicables. Cela aide le dépositaire à être du bon côté tout en prenant des décisions ou pour d'autres inférences.

Sommaire: La variance de la population se réfère à la valeur de la variance calculée à partir des données de population, et la variance de l'échantillon est la variance calculée à partir des données de l'échantillon. En raison de cette valeur du dénominateur dans la formule de la variance dans le cas des données de l'échantillon est «n-1», et il est «n» pour les données de la population. Par conséquent, la variance et l'écart-type dérivés des données d'échantillon sont plus élevés que ceux obtenus à partir des données démographiques.