Différences entre Corrélation et Régression La différence entre

Anonim

Les deux Corrélations et Régression sont des outils statistiques qui traitent de deux variables ou plus. Bien que les deux concernent le même sujet, il existe des différences entre les deux. Les différences entre les deux sont expliquées ci-dessous.

Signification

Le terme corrélation par rapport à deux variables ou plus signifie que les variables sont liées d'une manière ou d'une autre. L'analyse de corrélation détermine s'il existe une relation entre deux variables et la force de la relation. Si deux variables x (indépendantes) et y (dépendantes) sont si reliées que la variation de l'amplitude de la variable indépendante est accompagnée, par la variation de l'ampleur de la variable dépendante, les deux variables sont dites corrélées.

La corrélation peut être linéaire ou non linéaire. Une corrélation linéaire est une corrélation où les variables sont si reliées qu'un changement dans la valeur d'une variable entraînerait un changement constant de la valeur de l'autre variable. Dans une corrélation linéaire, les points dispersés liés aux valeurs respectives des variables dépendantes et indépendantes se regrouperaient autour d'une droite non horizontale, bien qu'une ligne droite horizontale indiquerait également une relation linéaire entre les variables si une droite pouvait relier les points représentant les variables.

D'autre part, l'analyse de régression utilise les données existantes pour déterminer une relation mathématique entre les variables qui peuvent être utilisées pour déterminer la valeur de la variable dépendante par rapport à n'importe quelle valeur de la variable indépendante..

Orientation statistique

La corrélation concerne la mesure de la force d'association ou de l'intensité de la relation, où la régression concerne la prédiction de la valeur de la variable dépendante par rapport à une valeur connue de la variable indépendante. Cela peut être expliqué avec les formules suivantes.

Le coefficient de corrélation ou la corrélation de coefficients (r) entre x et y est trouvé avec la formule suivante;

r = covariance (x, y) / σx. σy, Cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx et σy sont les écarts-types de x et y respectivement, et, -1

Le coefficient de corrélation r est un nombre pur et indépendant de l'unité de mesure. Ainsi, si x est la hauteur (en pouces) et y est le poids (en livres) des personnes d'une certaine région, alors r n'est ni en pouces ni en livres., mais simplement un nombre.

L'équation de régression est trouvée avec la formule suivante;

L'équation de régression de y sur x (pour trouver l'estimation de y) est y - y '= byx (x-x~), byx est appelé coefficient de régression de y sur x.L'équation de régression de x sur y (pour trouver l'estimation de x) est x - x '= bxy (y-y~), bxy est appelé coefficient de régression de x sur y.

L'analyse de corrélation n'assume aucune dépendance d'une variable par rapport à une autre variable, et elle n'essaie pas non plus de trouver la relation entre les deux. Il estime simplement le degré d'association entre les variables. En d'autres termes, l'analyse de corrélation teste l'interdépendance des variables. D'autre part, l'analyse de régression décrit la dépendance de la variable dépendante ou variable de réponse sur la / les variable (s) indépendante (s) ou explicative (s). L'analyse de régression suppose qu'il existe une relation causale unidirectionnelle entre les variables explicatives et les variables de réponse, et ne tient pas compte du fait que cette relation causale soit positive ou négative. Pour la corrélation, les valeurs des variables dépendantes et indépendantes sont toutes deux aléatoires, mais les valeurs de régression des variables indépendantes n'ont pas besoin d'être aléatoires.

Résumé

1. L'analyse de corrélation est un test d'interdépendance entre deux variables. L'analyse de régression donne une formule mathématique pour déterminer la valeur de la variable dépendante par rapport à une valeur de variable indépendante / s.

2. Le coefficient de corrélation est indépendant du choix de l'origine et de l'échelle, mais le coefficient de régression ne l'est pas.

Pour la corrélation, les valeurs des deux variables doivent être aléatoires, mais ce n'est pas le cas pour le coefficient de régression.

Bibliographie

1. Das, N. G., (1998), Méthodes statistiques, Calcutta

2. Corrélation et régression, disponible sur www. le. ac. uk / bl / gat / virtualfc / stats / régression

3. Régression et corrélation, disponible sur www. abîme. uoregon. edu