Afinal, para que serve Desvio Padrão?

Recentemente nós (eu e mais 3389 pessoas, aproximadamente devido aos faltantes) fizemos a prova do POSCOMP 2011. Hoje foi o dia da divulgação do resultado oficial para cada participante no site da COPS.

A média de acerto foi de 24 questões das 69 possíveis (apenas 34,78%), com desvio padrão de 7,1 (uma questão foi anulada e dois gabaritos foram alterados: 18 e 35). Com certeza uma prova super difícil se comparada com muitas outras.

Talvez você nem notou, mas “peraí”! Tem um 7,1 no parágrafo anterior, chamado de desvio padrão. Afinal de contas, você sabe para que este número pode ser utilizado? Até poucas horas eu nunca havia ficado curioso o suficiente para entendê-lo. Sabia que a partir dele é possível saber quantas pessoas acertaram o mesmo número de questões que você? Continue lendo!

A definição do desvio padrão conforme Wikipedia, na minha opnião, não ajuda muito. Definição bem formal, texto pra quem gosta de matemática mesmo, desde a infância! Mas o artigo: O que é Desvio Padrão, seção Na prática, o que isso significa?, do site Investpedia, veio bem a calhar para meu entendimento prático.

Aprendi (acho! se estiver errado me corrija por favor) que apenas com a média e desvio padrão, considerando uma distribuição normal, é possível encontrar algumas probabilidades bem interessantes, como:

  • Qual a probabilidade de alguém ter acertado apenas 01 (uma) questão na prova?
  • Qual a probabilidade de alguém ter acertado todas as 69 questões da prova?
  • Quantas pessoas acertaram 30 questões?

Mãos a obra. Só tenho três informações: Quantidade de candidatos (3390), Média de acertos (24) e Desvio padrão (7,1).

Usando a função =NORMDIST() do Open Office/Excel posso encontrar a probabilidade de acerto para cada quantidade de questões. Veja só:

Acertos Fórmula Resultado Pessoas (Resultado x 3390)
10 =NORMDIST(ACERTOS;MÉDIA;DESVIO;0) 0,80419% 27,26
20 =NORMDIST(ACERTOS;MÉDIA;DESVIO;0) 4,79435% 162,53

Probabilidade de Acertos
O gráfico ao lado foi construído a partir desta tabela completa. Perceba que a maior parte dos acertos estão próximos da média. Na verdade, entre (media – desvio padrão: 16,9) e (média + desvio padrão: 31,1). Para ser exato, de acordo com a regra 68-95-98, ou regra dos três sigmas 68,26% ou 2314 pessoas (parte vermelha).

Ainda de acordo com esta regra, 921 pessoas acertaram menos que 16,9 ou mais que 31,1 (Parte azul no gráfico.).

E vai afunilando: 145 pessoas menos que 9,8 ou mais que 38,2 (Parte verde no gráfico.).

E o espanto do POSCOMP 2011: Somente 09 pessoas acertaram menos que 2,7 ou mais que 45,3 questões! 45 questões são somente 65% da prova, ou seja, menos de 9 pessoas acima de 6,5!

Agora quero entender melhor como aplicar isso na análise de relatórios de sistemas ERP’s (vendas, financeiro, contabilidade, etc) e o que se enquadra na distribuição normal. Alguém tem algum exemplo prático de alguma análise? Agradeço muito se deixar um comentário abaixo!