Paramétrique vs non paramétrique
Les statistiques sont une branche d'études qui nous permet de comprendre la dynamique de la population en utilisant des échantillons tirés d'une certaine population d'intérêt. Il est essentiel que ces échantillons soient aléatoires. De nombreuses formules sont créées avec l'incorporation des mathématiques, pour prendre des inférences sur les paramètres de population. Naturellement, toute population peut avoir une «distribution normale» où la dispersion des données / échantillons a la forme d'une cloche dans le graphique de fréquence. Dans une distribution normale, la plupart des échantillons se concentrent autour de la moyenne et 68%, 95%, 99% des données se trouvent respectivement dans 1, 2 et 3 écarts-types. Les statistiques paramétriques et non paramétriques dépendent de la prise en compte ou non de la distribution normale.
Qu'est-ce que les statistiques paramétriques?
Les statistiques paramétriques sont les statistiques dans lesquelles les données / échantillons sont considérées comme tirées d'une distribution normale. La définition des statistiques paramétriques est «les statistiques qui suppose que les données proviennent d'un type de distribution de probabilité et font des inférences sur les paramètres de la distribution». La plupart des méthodes statistiques élémentaires connues appartiennent à ce groupe. En réalité, ils peuvent ne pas être normalement distribués. Par conséquent, ce type de statistiques est basé sur plus d'hypothèses. Si les données / échantillons sont normalement distribués ou presque normalement distribués, les formules peuvent produire des résultats et des inférences précises. Cependant, si l'hypothèse d'être normalement distribuée est erronée, les statistiques paramétriques pourraient être assez trompeuses.
Qu'est-ce que les statistiques non paramétriques?
Les statistiques non paramétriques sont également connues sous le nom de statistiques sans distribution. L'avantage de ce type de statistique est qu'il n'a pas à faire d'hypothèse comme précédemment fait avec Parametrics. Les calculs de statistiques non paramétriques attirent les médianes que les moyens. Par conséquent, si un ou deux s'écartent de la valeur moyenne, leur effet est négligé. Généralement, les statistiques paramétriques sont préférées que cela car elle a plus de pouvoir de rejeter une fausse hypothèse que la méthode non paramétrique. L'un des tests non paramétriques les plus connus est le test du chi carré. Il existe des analogues non paramétriques pour certains tests paramétriques tels que le test W Wilcoxon pour un échantillon apparié en T-test, le test de Mann-Whitney U pour les échantillons indépendants, la corrélation de Spearman pour la corrélation de Pearson, etc. Pour un échantillon de test t, il n'y a pas de test non paramétrique comparable.
Quelle est la différence entre paramétrique et non paramétrique?
• Les statistiques paramétriques dépendent de la distribution normale, mais les statistiques non paramétriques ne dépendent pas de la distribution normale.
• Les statistiques paramétriques font plus d'hypothèses que les statistiques non paramétriques.
• Les statistiques paramétriques utilisent des formules plus simples par rapport aux statistiques non paramétriques.
• Lorsqu'une population est censée être distribuée normalement ou à proximité de la distribution normalement distribuée, les statistiques paramétriques sont les meilleures à utiliser. Sinon, il est préférable qu'une méthode non paramétrique soit utilisée.
• La plupart des méthodes statistiques élémentaires communément connues appartiennent aux statistiques paramétriques. Les statistiques non paramétriques sont utilisées avec parcimonie et appliquées pour des cas spéciaux.