Différence entre les données catégorielles et les données numériques

Données catégorielles par rapport aux données numériques

Les données sont les faits ou les renseignements recueillis à des fins de référence ou d'analyse. Souvent, ces données sont collectées en tant qu'attribut du sujet concerné. Cet attribut peut varier d'un à l'autre, donc cet attribut variable peut être considéré comme une variable. Les variables peuvent prendre différentes formes de valeurs et celles-ci sont intrinsèques aux données collectées.

Les variables peuvent être qualitatives ou quantitatives; je. e. si la variable est quantitative, les réponses sont des nombres et l'ampleur de l'attribut mesuré peut être indiquée avec une certaine précision. L'autre type, les variables qualitatives mesurent les attributs qualitatifs et les valeurs assumées par les variables ne peuvent pas être données en termes de taille ou de grandeur. Les variables elles-mêmes sont connues sous le nom de variables catégorielles et les données recueillies au moyen d'une variable catégorique sont des données catégoriques.

En savoir plus sur les données numériques

Les données numériques sont essentiellement les données quantitatives obtenues à partir d'une variable, et la valeur a un sens de taille / grandeur. Les données numériques obtenues sont en outre divisées en trois autres catégories basées sur la théorie développée par Stanley Smith Stevens. Les données numériques peuvent être soit ordinales, soit périodiques, soit proportionnelles. Le type de données est déterminé par la méthode de mesure des valeurs, et les types sont connus comme des niveaux de mesure.

Le poids d'une personne, la distance entre deux points, la température et le prix d'un stock sont des exemples de données numériques.

En statistique, la majorité des méthodes est dérivée pour l'analyse des données numériques. Les statistiques descriptives de base et la régression et d'autres méthodes inférentielles sont principalement utilisées pour l'analyse des données numériques.

En savoir plus sur les données catégorielles

Les données catégorielles sont des valeurs pour une variable qualitative, souvent un nombre, un mot ou un symbole. Ils font ressortir le fait que la variable dans le cas considéré appartient à l'un des nombreux choix disponibles. Par conséquent, ils appartiennent à l'une des catégories; d'où le nom catégorique.

L'appartenance politique d'une personne, la nationalité d'une personne, la couleur préférée d'une personne et le groupe sanguin d'un patient sont des attributs qualitatifs. Parfois, un nombre peut être obtenu comme valeur catégorique, mais le nombre lui-même ne représente pas la grandeur de l'attribut mesuré.Le code postal est un exemple.

De plus, toutes les valeurs catégorielles appartiennent au type de données nominal, qui est un autre type basé sur les niveaux de mesure. Les méthodes utilisées pour analyser les données catégorielles sont différentes de celles des données numériques, mais le principe sous-jacent peut être le même.

Quelle est la différence entre les données catégorielles et numériques?

• Les données numériques sont des valeurs obtenues pour des variables quantitatives et portent un sens de grandeur lié au contexte de la variable (donc, ce sont toujours des nombres ou des symboles portant une valeur numérique). Les données catégoriques sont des valeurs obtenues pour une variable qualitative; les numéros de données catégoriques ne donnent pas un sens de grandeur.

• Les données numériques appartiennent toujours au type ordinal, ratio ou intervalle, alors que les données catégoriques appartiennent au type nominal.

• Les méthodes utilisées pour analyser les données quantitatives sont différentes des méthodes utilisées pour les données catégorielles, même si les principes sont les mêmes, l'application a au moins des différences significatives.

• Les données numériques sont analysées à l'aide de méthodes statistiques dans les statistiques descriptives, la régression, les séries chronologiques et bien d'autres.

• Pour les données catégoriques, on utilise habituellement des méthodes descriptives et des méthodes graphiques. Certains tests non paramétriques sont également utilisés.