Uma vez que a variância amostral se exprime nas unidades dos dados elevados ao quadrado, considera-se como medida de dispersão, não a variância, mas a sua raiz quadrada. Se representarmos os dados por x1, x2, ..., xn, e por ˉx a sua média, o desvio padrão obtém-se a partir da expressão

s=ni=1(xiˉx)2n1.

O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for o seu valor, maior será a dispersão dos dados.

Por exemplo, os dois conjuntos de dados, que têm a mesma média (igual a 4,9),


44,24,54,74,84,955,15,55,66,1

122,544,55,566,477,58

têm desvio padrão, respetivamente 0,6 e 2,3.



Como se verifica, tanto visualmente como a partir dos valores obtidos para o desvio padrão, a dispersão do segundo conjunto de dados é muito superior à do primeiro conjunto.

Além da expressão anterior, por vezes também se utiliza a expressão

s=ni=1(xiˉx)2n

quando a dimensão da amostra n é suficientemente grande (é usual considerar um valor de n superior a 30). Repare-se que nestas condições os valores de s são muito próximos de s, pois s/s=(n1)/n1.

Costuma-se utilizar o desvio padrão amostral, s, para estimar o desvio padrão populacional, σ.