Classification vs tabulation
La classification et la tabulation sont des méthodes de résumé des données dans les statistiques, ce qui fait une analyse plus approfondie des données pour tirer des inférences des données. Dans cet article, nous discuterons en détail des deux méthodes pour résumer les données et faire la distinction entre la classification et la tabulation des données.
Qu'est-ce que la classification des données?
Dans les statistiques, la classification est le processus de séparation des données en plusieurs classes ou groupes en utilisant des propriétés dans l'ensemble de données. Par exemple, les résultats des tests de mathématiques d'une classe peuvent être séparés en deux groupes en utilisant le sexe. Une telle classification condense les données brutes sous des formes appropriées pour l'analyse statistique et supprime les modèles de données complexes et met en évidence les représentants principaux des données brutes. Après la classification, des comparaisons peuvent être faites et les inférences peuvent être établies. Les données classifiées peuvent également fournir des relations ou des modèles de données corrélatives.
Les données brutes sont classées à l'aide de quatre caractéristiques clés, telles que des propriétés géographiques, chronologiques, qualitatives et quantitatives. Considérez un ensemble de données recueilli pour l'analyse des revenus des travailleurs du monde entier. Par exemple, le revenu d'un travailleur moyen peut être classé en fonction du pays du travailleur, où le facteur géographique est la métrique de la classification. Il peut également être classé en fonction des propriétés chronologiques telles que l'âge du travailleur. La profession de chaque travailleur fournit également une base qualitative pour la classification et les gammes salariales peuvent être utilisées comme base quantitative pour la classification.
Qu'est-ce que la tabulation des données?
Dans les statistiques, la tabulation est une méthode de résumé des données, en utilisant une disposition systématique des données dans les lignes et les colonnes. La tabulation est effectuée dans l'intention de mener une enquête, à titre de comparaison, pour identifier les erreurs et omissions dans les données, pour étudier une tendance dominante, pour simplifier les données brutes, pour utiliser l'espace économiquement et l'utiliser comme référence future.
Généralement, un tableau statistique a des composants suivants.
Composant | Description |
Titre | Le titre est une explication brève et claire des continues de la table |
Numéro de table | Un nombre est affecté à un tableau pour une identification facile lorsque de nombreuses tables sont incluses. |
Date | La date de la création du tableau doit être indiquée |
Désignations de lignes | Chaque ligne de la table reçoit un bref nom, généralement fourni dans la première colonne. Un tel nom est connu comme un «stub», et la colonne est connue sous le nom de «colonne de stub» |
Têtes de colonne | Chaque colonne reçoit une rubrique pour expliquer la nature des figures incluses dans chaque colonne. Ces noms sont appelés «légendes» ou «titres». |
Corps de la table | Les données sont entrées dans le corps principal et doivent être créées pour une identification facile de chaque élément de données. Les valeurs numériques sont souvent commandées dans l'ordre croissant ou descendant. |
Unité de mesure | L'unité de mesure des valeurs dans le corps du tableau doit être indiquée. |
Sources | Les tableaux doivent fournir les sources primaires et secondaires pour les données sous le corps du tableau. |
Notes de bas de page et références | Détails supplémentaires pour clarifier le contenu de la table. |
Sur la base des tables à des fins, les tableaux peuvent être classés en trois catégories principales.
Quelle est la différence entre la classification et la tabulation?
• En classification, les données sont séparées et regroupées en fonction d'une propriété des données communes à toutes les valeurs.
• Dans la tabulation, les données sont organisées en colonnes et lignes en fonction des caractéristiques / propriétés, ou des indicateurs.
• La tabulation met souvent l'accent sur les aspects de présentation des données, tandis que la classification est utilisée comme moyen de tri des données pour une analyse plus approfondie.