Se representarmos por (x,y)={ ( xi,yi ) }, com i = 1,...,n, uma amostra de dados bivariados, a covariância amostral entre as variáveis x e y é dada pela seguinte expressão:


Cov(x,y)=1n1ni=1(xiˉx)(yiˉy),ondeˉx=1nni=1xieˉy=1nni=1yi


Uma associação linear entre os x’s e os y’s, do mesmo sentido, isto é, quando a valores grandes (pequenos) de x correspondem, de um modo geral, valores grandes (pequenos) de y, faz com que predominem as parcelas positivas na expressão da covariância, pois quando (xiˉx)>0(<0) , tende a ser (yiˉy)>0(<0). Então a covariância vem positiva. Geometricamente, tem-se:



Uma associação linear entre os x’s e os y’s, de sentido contrário, isto é, quando a valores grandes (pequenos) de x correspondem, de um modo geral, valores pequenos (grandes) de y, faz com que predominem as parcelas negativas na expressão da covariância, pois quando (xiˉx)>0(<0), tende a ser (yiˉy)>0(<0). Então a covariância vem negativa. Geometricamente, tem-se:



Se não se verificar uma associação linear entre as variáveis, então nem predominam as parcelas positivas, nem as negativas, obtendo-se para a covariância um valor próximo de 0. Geometricamente tem-se:



A covariância é uma medida que tem o inconveniente de depender das unidades com que se apresentam os elementos da amostra, pelo que não é normalmente usada. Em sua substituição utiliza-se o coeficiente de correlação amostral, que não depende das unidades utilizadas.