Variance vs covariance
La variance et la covariance sont deux mesures utilisées dans les statistiques. La variance est une mesure de la dispersion des données, et la covariance indique le degré de changement de deux variables aléatoires ensemble. La variance est plutôt un concept intuitif, mais la covariance est définie mathématiquement dans non pas si intuitive au début.
En savoir plus sur la variance
La variance est une mesure de la dispersion des données de la valeur moyenne de la distribution. Il indique jusqu'où les points de données se trouvent de la moyenne de la distribution. C'est l'un des principaux descripteurs de la distribution de probabilité et l'un des moments de la distribution. De plus, la variance est un paramètre de la population, et la variance d'un échantillon de la population agit comme un estimateur de la variance de la population. D'un point de vue, il est défini comme le carré de l'écart type.
En langage simple, il peut être décrit comme la moyenne des carrés de la distance entre chaque point de données et la moyenne de la distribution. La formule suivante est utilisée pour calculer la variance.
Var (x) = e [(x-µ)2 ] pour une population, et
Var (x) = e [(x-‾x)2 ] pour un échantillon
Il peut en outre être simplifié pour donner var (x) = e [x2 ]-(EX])2.
La variance a des propriétés de signature et souvent utilisées dans les statistiques pour simplifier l'utilisation. La variance est non négative car elle est le carré des distances. Cependant, la plage de la variance n'est pas confinée et dépend de la distribution particulière. La variance d'une variable aléatoire constante est nulle, et la variance ne change pas par rapport à un paramètre de localisation.
En savoir plus sur la covariance
Dans la théorie statistique, la covariance est une mesure de la façon dont deux variables aléatoires changent ensemble. En d'autres termes, la covariance est une mesure de la force de la corrélation entre deux variables aléatoires. Il peut également être considéré comme une généralisation du concept de variance de deux variables aléatoires.
La covariance de deux variables aléatoires x et y, qui sont réparties conjointement avec une deuxième quantité de mouvement finie, est connue sous le nom de σXy= E [(x-e [x]) (y-e [y])]. De cela, la variance peut être considérée comme un cas spécial de covariance, où deux variables sont les mêmes. Cov (x, x) = var (x)
En normalisant la covariance, le coefficient de corrélation linéaire ou le coefficient de corrélation de Pearson peut être obtenu, qui est défini comme ρ = e [(x-e [x]) (y-e [y]) / (σX σY ) = (Cov (x, y)) / (σX σY)
Graphiquement, la covariance entre une paire de points de données peut être considérée comme la zone du rectangle avec les points de données aux sommets opposés. Il peut être interprété comme une mesure de l'ampleur de la séparation entre les deux points de données. Compte tenu des rectangles de l'ensemble de la population, le chevauchement des rectangles correspondant à tous les points de données peut être considéré comme la force de la séparation; variance des deux variables. La covariance est en deux dimensions, en raison de deux variables, mais la simplifier à une variable donne la variance d'un seul comme séparation dans une dimension.
Quelle est la différence entre la variance et la covariance?
• La variance est la mesure de l'écart / dispersion dans une population tandis que la covariance est considérée comme une mesure de la variation de deux variables aléatoires ou la force de la corrélation.
• La variance peut être considérée comme un cas particulier de covariance.
• La variance et la covariance dépendent de l'ampleur des valeurs de données et ne peuvent pas être comparées; Par conséquent, ils sont normalisés. La covariance est normalisée dans le coefficient de corrélation (division par le produit des écarts-types des deux variables aléatoires) et la variance est normalisée en écart type (en prenant la racine carrée)