Différence entre T-TEST et ANOVA Différence entre

Anonim

T-TEST vs. ANOVA

Rassembler et calculer des données statistiques pour obtenir la moyenne un processus long et fastidieux. Le test t et l'analyse de variance unidirectionnelle (ANOVA) sont les deux tests les plus couramment utilisés à cette fin.

Le test t est un test d'hypothèse statistique dans lequel la statistique de test suit la distribution t de Student si l'hypothèse nulle est prise en charge. Ce test est appliqué lorsque la statistique de test suit une distribution normale et que la valeur d'un terme de mise à l'échelle dans la statistique de test est connue. Si le terme d'échelle est inconnu, il est alors remplacé par une estimation basée sur les données disponibles. La statistique de test suivra la distribution t d'un étudiant.

William Sealy Gosset introduisit le t-statistique en 1908. Gosset était chimiste pour la brasserie Guinness à Dublin, en Irlande. La brasserie Guinness avait pour politique de recruter les meilleurs diplômés d'Oxford et de Cambridge, en choisissant parmi ceux qui pouvaient fournir des applications de la biochimie et des statistiques aux processus industriels établis de l'entreprise. William Sealy Gosset était l'un de ces diplômés. Dans le processus, William Sealy Gosset a conçu le test t, qui était à l'origine envisagé comme un moyen de contrôler la qualité de la bière (la bière brune produite par la brasserie) d'une manière rentable. Gosset a publié le test sous le pseudonyme «Student» dans Biometrika, vers 1908. La raison du nom de plume était l'insistance de Guinness, car l'entreprise voulait maintenir sa politique sur l'utilisation des statistiques dans le cadre de ses «secrets commerciaux».

Les statistiques du test T suivent généralement la forme T = Z / s, où Z et s sont des fonctions des données. La variable Z est conçue pour être sensible à l'hypothèse alternative; En effet, l'amplitude de la variable Z est plus grande lorsque l'hypothèse alternative est vraie. En attendant, 's' est un paramètre d'échelle, permettant de déterminer la distribution de T. Les hypothèses sous-jacentes à un test t sont les suivantes: a) Z suit une distribution normale normale sous l'hypothèse nulle; b) ps2 suit une distribution Ï ‡ 2 avec p degrés de liberté sous l'hypothèse nulle (où p est une constante positive); et c) la valeur Z et la valeur s sont indépendantes. Dans un type spécifique de test t, ces conditions sont des conséquences de la population étudiée, ainsi que de la façon dont les données sont échantillonnées.

D'autre part, l'analyse de variance (ANOVA) est une collection de modèles statistiques. Si les principes de l'ANOVA ont longtemps été utilisés par les chercheurs et les statisticiens, ce n'est qu'en 1918 que Sir Ronald Fisher a formulé une proposition pour formaliser l'analyse de la variance dans un article intitulé «Corrélation entre les parents sur l'hypothèse de l'héritage mendélien»..Depuis lors, ANOVA a été élargi dans sa portée et son application. L'ANOVA est en réalité un abus de langage, car il ne provient pas des différences de variances mais plutôt des différences entre les moyennes des groupes. Il comprend les procédures associées où la variance observée dans une variable particulière est divisée en composantes attribuables à différentes sources de variation.

Essentiellement, une ANOVA fournit un test statistique pour déterminer si les moyennes de plusieurs groupes sont toutes égales et, par conséquent, généralise le test t à plus de deux groupes. Une ANOVA peut être plus utile qu'un test t à deux échantillons car elle a moins de chance de commettre une erreur de type I. Par exemple, avoir plusieurs tests t à deux échantillons aurait plus de chance de commettre une erreur qu'une ANOVA des mêmes variables impliquées pour obtenir la moyenne. Le modèle est le même et la statistique de test est le rapport F. En termes plus simples, les t-tests ne sont qu'un cas particulier de ANOVA: faire une ANOVA aura le même résultat que plusieurs t-tests. Il existe trois classes de modèles ANOVA: a) Les modèles à effets fixes qui supposent que les données proviennent de populations normales, ne différant que par leurs moyens; b) les modèles à effets aléatoires qui supposent que les données décrivent une hiérarchie de populations variables dont les différences sont contraintes par la hiérarchie; et c) les modèles à effets mixtes qui sont des situations où les effets fixes et aléatoires sont présents.

Résumé:

Le test t est utilisé pour déterminer si deux moyennes ou moyennes sont identiques ou différentes. L'ANOVA est préférée lorsqu'on compare trois moyennes ou moyennes ou plus.

  1. Un test t a plus de chances de commettre une erreur, plus les moyens sont utilisés, c'est pourquoi l'ANOVA est utilisée pour comparer deux moyennes ou plus.