Statistiques descriptives vs inférentiels
Les statistiques sont la discipline de la collecte, de l'analyse et de la présentation des données. La théorie des statistiques est divisée en deux branches sur la base des informations qu'ils produisent en analysant les données.
Qu'est-ce que les statistiques descriptives?
Les statistiques descriptives sont la branche des statistiques qui décrivent les principales propriétés d'un ensemble de données quantitativement. Pour représenter les propriétés d'un ensemble de données aussi précisément que possible, les données sont résumées à l'aide d'outils graphiques ou numériques.
Le résumé graphique se fait en tabulant, en regroupant et en représentant les valeurs des variables d'intérêt. Distribution de fréquence et les histogrammes de distribution de fréquence relative sont de telles représentations. Ils représentent la distribution des valeurs dans toute la population.
Le résumé numérique consiste à calculer des mesures descriptives telles que la moyenne, le mode et la moyenne. Les mesures descriptives sont en outre classées en deux classes; Ce sont des mesures de la tendance centrale et des mesures de la dispersion / variation. Les mesures de la tendance centrale sont la moyenne / la moyenne, la médiane et le mode. Chacun a son propre niveau d'applicabilité et d'utilité. Lorsque l'un peut échouer, l'autre peut mieux représenter l'ensemble de données.
Comme son nom l'indique, les mesures de la dispersion impliquent de mesurer la distribution des données. La plage, l'écart type, la variance, les centiles et les gammes de quartiles, et le coefficient de variation sont des mesures de dispersion. Ils fournissent des informations sur la diffusion des données.
Un exemple simple de l'utilisation des statistiques descriptives est le calcul de la moyenne pondérée cumulative d'un étudiant. Le GPA est en substance en substance la moyenne pondérée des résultats des étudiants et reflète le rendement scolaire global de cet étudiant en particulier.
Qu'est-ce que les statistiques inférentielles?
Les statistiques inférentielles sont la branche des statistiques, qui tirent des conclusions sur la population concernée de l'ensemble de données obtenu à partir d'un échantillon soumis à des variations aléatoires, observationnelles et d'échantillonnage. En général, les résultats sont obtenus à partir d'un échantillon aléatoire de la population et les conclusions dérivées de l'échantillon sont ensuite généralisées pour représenter l'ensemble.
L'échantillon est un sous-ensemble de la population et les mesures des statistiques descriptives pour les données acquises de l'échantillon sont simplement connues sous le nom statistiques. Les mesures des statistiques descriptives obtenues à partir de l'analyse de l'échantillon sont appelées paramètres lorsqu'elles sont appliquées à la population, et elles représentent l'ensemble de la population.
Les statistiques inférentielles se concentrent sur la façon de généraliser les statistiques obtenues à partir d'un échantillon aussi précisément que possible pour représenter la population. Un facteur de préoccupation est la nature de l'échantillon. Si l'échantillon est biaisé, les résultats sont également biaisés et les paramètres basés sur ceux-ci ne représentent pas correctement la population. Par conséquent, l'échantillonnage est une étude importante des statistiques inférentielles. Hypothèses statistiques, théorie de la décision statistique et théorie de l'estimation, test d'hypothèse, conception des expériences, analyse de la variance et analyse de la régression sont des sujets d'étude importants dans la théorie des statistiques inférentielles.
Un bon exemple de statistiques inférentielles en action est la prédiction des résultats d'une élection avant le vote au moyen d'un sondage.
Quelle est la différence entre les statistiques descriptives et inférentielles?
• Les statistiques descriptives se concentrent sur le résumé des données collectées à partir d'un échantillon. La technique produit des mesures de tendance et de dispersion centrales qui représentent la façon dont les valeurs des variables sont concentrées et dispersées.
• Les statistiques inférentielles généralisent les statistiques obtenues d'un échantillon à la population générale à laquelle l'échantillon appartient. Les mesures de la population sont appelées paramètres.
• Les statistiques descriptives ne font que le résumé des propriétés de l'échantillon à partir de laquelle les données ont été acquises, mais dans les statistiques inférentielles, la mesure de l'échantillon est utilisée pour déduire les propriétés de la population.
• Dans les statistiques inférentielles, les paramètres ont été obtenus à partir d'un échantillon, mais pas de la population entière; Par conséquent, il existe toujours une certaine incertitude par rapport aux valeurs réelles.