A variância amostral é uma medida de dispersão ou variabilidade dos dados, relativamente à medida de localização média. Se representarmos os dados por \({\rm{x_{1}, x_{2}, ..., x_{n}}}\), a variância obtém-se a partir da expressão


\[{\rm{s}^{2} } =\frac{\sum \limits_{ {\rm {i} }={\rm {1} } }^{ {\rm {n} } }{\rm {(x}_{ {\rm {i} } } -\bar{ {\rm {x} } }{ \rm{ )} }^{ {\rm {2} } } } }{ {\rm {n} } - {\rm{1} } } \]


Além da expressão anterior, por vezes tembém se utiliza a expressão


\[{\rm{s} {'}^{2}} =\frac{\sum \limits_{ {\rm {i}}={\rm {1} } }^{ {\rm {n} } }{\rm {(x}_{ {\rm {i} } } -\bar{ {\rm {x} } } { \rm{ )} }^{ {\rm {2} } } } }{ {\rm {n} } } \]

Estas duas estatísticas podem ser utilizadas para estimar o parâmetro variância populacional \(\sigma^{2}\). No entanto as estimativas \(\rm{s}^{2}\), para amostras de dimensão pequena, têm tendência para estarem mais próximas do parâmetro a estimar do que \({\rm{s}{'}^{2}}\) (ver estatísticas).

Suponha que se pretendia estimar a variância (populacional) dos frangos (machos) de 2 meses, criados num certo aviário. Para tal, selecionaram-se ao acaso 20 frangos, que se pesaram, tendo-se obtido os seguintes valores (em kg):


\(2,64 \quad \quad 2,38 \quad \quad 2,30 \quad \quad 2,69 \quad \quad 2,32 \quad \quad 2,66 \quad \quad 2,36 \quad \quad 2,70 \quad \quad 2,49 \quad \quad 1,56\)

\(2,33 \quad \quad 2,26 \quad \quad 2,15 \quad \quad 2,45 \quad \quad 2,02 \quad \quad 2,73 \quad \quad 3,09 \quad \quad 2,47 \quad \quad 2,44 \quad \quad 2,79\)


Calculando a média dos valores anteriores obtém-se \(\bar{\rm {x}}\) = 2,44kg. Para calcular a variância (amostral) considera-se


\[\rm{s^{2}= \frac{(2,64-2,44)^{2} + (2,38-2,44)^{2}+ ... + (2,79-2,44)^{2}}{19}}\]
\(\quad \quad =\rm{0,10}\)

Assim, o valor de 0,10kg2 é uma estimativa da variância pretendida.


Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e tem-se o desvio padrão amostral que é a medida que geralmente se utiliza para medir a variabilidade dos dados relativamente à medida de localização média.