Différence entre les données catégorielles et les données numériques

Différence entre les données catégorielles et les données numériques

Données catégoriques vs données numériques

Les données sont les faits ou les informations collectées à des fins de référence ou d'analyse. Souvent, ces données sont collectées comme un attribut du sujet concerné. Cet attribut peut varier de l'un à l'autre, donc cet attribut variable peut être considéré comme une variable. Les variables peuvent supposer différentes formes de valeurs et celles-ci sont intrinsèques dans les données collectées.

Les variables peuvent être qualitatives ou quantitatives; je.e. Si la variable est quantitative, les réponses sont des nombres et l'ampleur de l'attribut mesuré peut être indiquée avec un certain degré de précision. L'autre type, les variables qualitatives mesurent les attributs qualitatifs et les valeurs supposées par les variables ne peuvent pas être données en termes de taille ou de magnitude. Les variables elle-même sont appelées variables catégorielles et les données collectées au moyen d'une variable catégorique sont des données catégorielles.

En savoir plus sur les données numériques

Les données numériques sont essentiellement les données quantitatives obtenues à partir d'une variable, et la valeur a un sentiment de taille / magnitude. Les données numériques obtenues sont divisées en trois autres catégories basées sur la théorie développée par Stanley Smith Stevens. Les données numériques peuvent être ordinales, intervalles ou rapport. Le type de données est déterminé par la méthode de mesure des valeurs, et les types sont appelés niveaux de mesure.

Le poids d'une personne, la distance entre deux points, la température et le prix d'un stock sont des exemples de données numériques.

Dans les statistiques, la majorité des méthodes sont dérivées de l'analyse des données numériques. Les statistiques descriptives de base et la régression et d'autres méthodes inférentielles sont principalement utilisées pour l'analyse des données numériques.

En savoir plus sur les données catégorielles

Les données catégorielles sont des valeurs pour une variable qualitative, souvent un nombre, un mot ou un symbole. Ils font ressortir le fait que la variable dans le cas considéré appartient à l'un des nombreux choix disponibles. Par conséquent, ils appartiennent à l'une des catégories; D'où le nom catégorique.

L'affiliation politique d'une personne, la nationalité d'une personne, la couleur préférée d'une personne et le groupe sanguin d'un patient sont des attributs qualitatifs. Parfois, un nombre peut être obtenu en valeur catégorique, mais le nombre lui-même ne représente pas l'ampleur de l'attribut mesuré. Le code postal est un exemple.

De plus, toutes les valeurs catégorielles appartiennent au type de données nominal, qui est un autre type basé sur les niveaux de mesures. Les méthodes utilisées pour analyser les données catégorielles sont différentes de celles des données numériques, mais le principe sous-jacent peut être le même.

Quelle est la différence entre les données catégorielles et numériques?

• Les données numériques sont des valeurs obtenues pour une variable quantitative et porte un sentiment de magnitude lié au contexte de la variable (par conséquent, ce sont toujours des nombres ou des symboles portant une valeur numérique). Les données catégorielles sont des valeurs obtenues pour une variable qualitative; Les numéros de données catégoriques ne portent pas de sens de l'ampleur.

• Les données numériques appartiennent toujours à un type ordinal, à un type d'intervalle, tandis que les données catégorielles appartiennent au type nominal.

• Les méthodes utilisées pour analyser les données quantitatives sont différentes des méthodes utilisées pour les données catégorielles, même si les principes sont les mêmes au moins, l'application a des différences significatives.

• Les données numériques sont analysées à l'aide de méthodes statistiques dans les statistiques descriptives, la régression, les séries chronologiques et bien d'autres.

• Pour les données catégorielles, des méthodes et des méthodes graphiques, habituellement, sont utilisées. Certains tests non paramétriques sont également utilisés.