Différence entre les statistiques descriptives et inférentielles: statistiques descriptives et inférentielles comparées

Anonim

vs statistiques inférentielles

La statistique est la discipline de collecte, d'analyse et de présentation des données. La théorie de la statistique est divisée en deux branches sur la base des informations qu'elles produisent en analysant les données.

Qu'est-ce que les statistiques descriptives?

La statistique descriptive est la branche des statistiques qui décrivent quantitativement les principales propriétés d'un ensemble de données. Pour représenter les propriétés d'un ensemble de données aussi précisément que possible, les données sont résumées à l'aide d'outils graphiques ou numériques.

Le résumé graphique se fait en totalisant, en regroupant et en représentant graphiquement les valeurs des variables d'intérêt. Les histogrammes de distribution de fréquence et de distribution de fréquence relative sont de telles représentations. Ils décrivent la distribution des valeurs à travers la population.

Le résumé numérique consiste à calculer des mesures descriptives telles que la moyenne, le mode et la moyenne. Les mesures descriptives sont ensuite classées en deux catégories; ce sont des mesures de tendance centrale et des mesures de dispersion / variation. Les mesures de tendance centrale sont la moyenne / moyenne, la médiane et le mode. Chacun a son propre niveau d'applicabilité et d'utilité. Là où l'un peut échouer, l'autre peut mieux représenter l'ensemble de données.

Comme son nom l'indique, les mesures de dispersion impliquent la mesure de la distribution des données. La gamme, l'écart-type, la variance, les percentiles et les plages de quartiles et le coefficient de variation sont des mesures de dispersion. Ils fournissent des informations sur la propagation des données.

Un simple exemple d'utilisation de statistiques descriptives consiste à calculer la moyenne pondérée d'un élève. Le GPA en substance est la moyenne pondérée des résultats des étudiants et est un reflet de la performance académique globale de cet étudiant en particulier.

Qu'est-ce que les statistiques inférentielles?

La statistique inférentielle est la branche statistique qui tire des conclusions sur la population concernée à partir de l'ensemble de données obtenu à partir d'un échantillon soumis à des variations aléatoires, d'observation et d'échantillonnage. En général, les résultats sont obtenus à partir d'un échantillon aléatoire de la population et les conclusions tirées de l'échantillon sont ensuite généralisées pour représenter l'ensemble de la population.

L'échantillon est un sous-ensemble de la population, et les mesures des statistiques descriptives pour les données acquises à partir de l'échantillon sont simplement appelées statistiques.Les mesures de statistiques descriptives obtenues à partir de l'analyse de l'échantillon sont appelées paramètres lorsqu'elles sont appliquées à la population et représentent l'ensemble de la population.

Les statistiques inférentielles se concentrent sur la façon de généraliser les statistiques obtenues à partir d'un échantillon aussi précisément que possible pour représenter la population. Un facteur de préoccupation est la nature de l'échantillon. Si l'échantillon est biaisé, les résultats sont également biaisés et les paramètres basés sur ceux-ci ne représentent pas la totalité de la population correctement. Par conséquent, l'échantillonnage est une étude importante des statistiques inférentielles. Les hypothèses statistiques, la théorie de la décision statistique et la théorie de l'estimation, le test des hypothèses, la conception des expériences, l'analyse de la variance et l'analyse de la régression sont des sujets d'étude importants dans la théorie des statistiques inférentielles.

Un bon exemple de statistiques inférentielles en action est la prévision des résultats d'une élection précédant le vote par sondage.

Quelle est la différence entre les statistiques descriptives et inférentielles?

• Les statistiques descriptives sont axées sur la récapitulation des données recueillies à partir d'un échantillon. La technique produit des mesures de tendance centrale et de dispersion qui représentent comment les valeurs des variables sont concentrées et dispersées.

• Les statistiques inférentielles généralisent les statistiques obtenues d'un échantillon à la population générale à laquelle appartient l'échantillon. Les mesures de la population sont qualifiées de paramètres.

• Les statistiques descriptives ne font que résumer les propriétés de l'échantillon à partir duquel les données ont été acquises, mais dans les statistiques inférentielles, la mesure de l'échantillon est utilisée pour déduire les propriétés de la population.

• Dans les statistiques d'inférence, les paramètres ont été obtenus à partir d'un échantillon, mais pas de la population entière; par conséquent, il existe toujours une certaine incertitude par rapport aux valeurs réelles.