Corrélation vs covariance
La corrélation et la covariance sont des concepts étroitement liés dans les statistiques théoriques. Ils sont importants pour déterminer la relation entre deux variables aléatoires.
Qu'est-ce que la corrélation?
La corrélation est une mesure de la force de la relation entre deux variables. Le coefficient de corrélation quantifie le degré de changement d'une variable basée sur le changement de l'autre variable. Dans les statistiques, la corrélation est liée au concept de dépendance, qui est la relation statistique entre deux variables
Le coefficient de corrélation de Pearson ou simplement le coefficient de corrélation r est une valeur entre -1 et 1 (-1≤r≤ + 1). C'est le coefficient de corrélation le plus couramment utilisé et valide uniquement pour une relation linéaire entre les variables. Si r = 0, aucune relation n'existe, et si R≥0, la relation est directement proportionnelle; La valeur d'une variable augmente avec l'augmentation de l'autre. Si R≤0, la relation est inversement proportionnelle; une diminution variable à mesure que l'autre augmente.
En raison de la condition de linéarité, le coefficient de corrélation R peut également être utilisé pour établir la présence d'une relation linéaire entre les variables.
Qu'est-ce que la covariance?
Dans la théorie statistique, la covariance est une mesure de la façon dont deux variables aléatoires changent ensemble. En d'autres termes, la covariance est une mesure de la force de la corrélation entre deux variables aléatoires.
Dans une autre perspective, on peut voir que la corrélation n'est que la version normalisée de la covariance, où la covariance est divisée par le produit des écarts-types des deux variables aléatoires. La gamme de covariance peut être importante; Par conséquent, ce n'est pas facile à comparer. Cette difficulté est surmontée en apportant les valeurs de covariance à une gamme où elle peut être comparée en la normalisant (un peu comme ce que fait Z-Score). Bien que la covariance et la variance soient liées les unes aux autres de la manière ci-dessus, leurs distributions de probabilité ne sont pas attachées les unes aux autres de manière simple et doivent être traitées séparément.
Quelle est la différence entre la corrélation et la covariance?
• La corrélation et la covariance sont des mesures de relation entre deux variables aléatoires. La corrélation est la mesure de la force de la linéarité des deux variables et la covariance est une mesure de la résistance de la corrélation.
• Les valeurs de coefficient de corrélation sont une valeur entre -1 et +1, tandis que la plage de covariance n'est pas constante, mais peut être positive ou négative. Mais si les variables aléatoires sont normalisées avant de calculer la covariance, la covariance est égale à la corrélation et a une valeur comprise entre -1 et +1.