Dadas as variáveis aleatórias X e Y com valores médios \({\mu _x}\) e \({\mu _y}\) e desvios padrões \({\sigma _x}\) e \({\sigma _y}\), superiores a zero, o coeficiente de correlação de Pearson \(\rho\), entre X e Y, calcula-se a partir da seguinte fórmula:


\(\rho = \displaystyle\frac{ { {\rm{E} }\left[ { {\rm{(X - } } { {\rm{\mu } }_{\rm{x} } } {\rm{)(Y} } - { {\rm{\mu } }_{\rm{y} } } {\rm{)} } } \right]} } { { { {\rm{\sigma } }_{\rm{x} }}{\rm{ } } { {\rm{\sigma } }_{\rm{y} } } } }\),

ou seja, o coeficiente de correlação \(\rho\) para o par de variáveis aleatórias (X,Y) é o quociente entre a covariância populacional das variáveis aleatórias X e Y e o produto dos desvios padrões respetivos:

\(\rho = \displaystyle \frac{ { {\rm{Cov(X} } {\rm{,Y)} } } } { { { {\rm{\sigma } }_{\rm{x} } } {\rm{ } } { {\rm{\sigma } }_{\rm{y} } } } }\).

Tal como o coeficiente de correlação amostral, também se pode provar que o coeficiente de correlação populacional assume valores no intervalo [-1,1].

Se as variáveis aleatórias X e Y são independentes, então o coeficiente de correlação \(\rho\) vem igual a 0. No entanto, o inverso não é necessariamente verdadeiro, pois pode o coeficiente de correlação ser nulo, sem que as variáveis aleatórias sejam independentes, já que \(\rho\) só mede a associação linear. Existe, contudo, uma situação de exceção em que coeficiente de correlação \(\rho\) nulo e independência são equivalentes, que é o caso do par (X, Y) ser binormal (para saber mais consultar, por exemplo, Murteira et al. (2002), página 259 e Pestana e Velosa (2010), página 935).

O coeficiente de correlação populacional \(\rho\) pode ser estimado pelo coeficiente de correlação amostral r.