Afinal, para que serve Desvio Padrão?

Recentemente nós (eu e mais 3389 pessoas, aproximadamente devido aos faltantes) fizemos a prova do POSCOMP 2011. Hoje foi o dia da divulgação do resultado oficial para cada participante no site da COPS.

A média de acerto foi de 24 questões das 69 possíveis (apenas 34,78%), com desvio padrão de 7,1 (uma questão foi anulada e dois gabaritos foram alterados: 18 e 35). Com certeza uma prova super difícil se comparada com muitas outras.

Talvez você nem notou, mas “peraí”! Tem um 7,1 no parágrafo anterior, chamado de desvio padrão. Afinal de contas, você sabe para que este número pode ser utilizado? Até poucas horas eu nunca havia ficado curioso o suficiente para entendê-lo. Sabia que a partir dele é possível saber quantas pessoas acertaram o mesmo número de questões que você? Continue lendo!

A definição do desvio padrão conforme Wikipedia, na minha opnião, não ajuda muito. Definição bem formal, texto pra quem gosta de matemática mesmo, desde a infância! Mas o artigo: O que é Desvio Padrão, seção Na prática, o que isso significa?, do site Investpedia, veio bem a calhar para meu entendimento prático.

Aprendi (acho! se estiver errado me corrija por favor) que apenas com a média e desvio padrão, considerando uma distribuição normal, é possível encontrar algumas probabilidades bem interessantes, como:

  • Qual a probabilidade de alguém ter acertado apenas 01 (uma) questão na prova?
  • Qual a probabilidade de alguém ter acertado todas as 69 questões da prova?
  • Quantas pessoas acertaram 30 questões?

Mãos a obra. Só tenho três informações: Quantidade de candidatos (3390), Média de acertos (24) e Desvio padrão (7,1).

Usando a função =NORMDIST() do Open Office/Excel posso encontrar a probabilidade de acerto para cada quantidade de questões. Veja só:

Acertos Fórmula Resultado Pessoas (Resultado x 3390)
10 =NORMDIST(ACERTOS;MÉDIA;DESVIO;0) 0,80419% 27,26
20 =NORMDIST(ACERTOS;MÉDIA;DESVIO;0) 4,79435% 162,53

Probabilidade de Acertos
O gráfico ao lado foi construído a partir desta tabela completa. Perceba que a maior parte dos acertos estão próximos da média. Na verdade, entre (media – desvio padrão: 16,9) e (média + desvio padrão: 31,1). Para ser exato, de acordo com a regra 68-95-98, ou regra dos três sigmas 68,26% ou 2314 pessoas (parte vermelha).

Ainda de acordo com esta regra, 921 pessoas acertaram menos que 16,9 ou mais que 31,1 (Parte azul no gráfico.).

E vai afunilando: 145 pessoas menos que 9,8 ou mais que 38,2 (Parte verde no gráfico.).

E o espanto do POSCOMP 2011: Somente 09 pessoas acertaram menos que 2,7 ou mais que 45,3 questões! 45 questões são somente 65% da prova, ou seja, menos de 9 pessoas acima de 6,5!

Agora quero entender melhor como aplicar isso na análise de relatórios de sistemas ERP’s (vendas, financeiro, contabilidade, etc) e o que se enquadra na distribuição normal. Alguém tem algum exemplo prático de alguma análise? Agradeço muito se deixar um comentário abaixo!

Anúncios

9 comentários sobre “Afinal, para que serve Desvio Padrão?

  1. É muito complicado aplicar este tipo de análise em situações típicas dos relatórios ERPs. Em primeiro lugar por que questões financeiras normalmente não possuem distribuição normal. Além disso muitas vezes a comparação entre valores é vazia de significado (vender 10 milhões em um ano é muito diferente de vender 10 milhões há 10 anos atrás), e a estatística só tem sentido quando você tem muitos valores para comparar (média e desvio padrão de 10 valores tem pouco significado, média e desvio de padrão de 1 milhão de valores já te diz muita coisa.)

    O principal uso deste tipo de análise no mundo corporativo acontece no controle de qualidade (qual a média de peso do pacote de biscoito? qual o desvio padrão? um desvio padrão alto significa qualidade do empacotamento baixo, uma média alta significa perda para a empresa, e uma média baixa significa que a empresa está roubando o consumidor). Outro uso importante é o de análise de risco.

    E pra ficar com um contraponto ao uso da distribuição normal recomendo o livre Cisne Negro.

    O uso da média e do desvio padrão também pode ser usado para comparar coisas que não podem ser comparadas e é por isso que se usa tanto em avaliação educacional. Nós fizemos uma prova (talvez mais fácil, talvez mais dificil). A média e o desvio padrão são usadas neste caso para permitir a comparação entre nós que fizemos a prova este ano e pessoas que fizeram a prova em anos anteriores.

    Pode ser usada para comparar dois vendedores que atuem em regiões diferentes por exemplo. Se o vendedor da região A vende mais do que o da região B, a causa pode ser que a região A seja mais rica do que a região B. Agora se o vendedor da região A está acima da média em 1 d.p. dos outros vendedores da região A, enquanto o vendedor da região B está na média dos outros vendedores da região B, então o vendedor da região A é melhor do que o vendedor da região B.

    Curtir

  2. Muito bacana seu artigo…realmente eu fiz essa análise também, que se mostra um tanto animadora para quem obteve notas acima de 32 hehehe…

    Quando estudei probabilidade [fiz faculdade de matemática], sempre que uma amostra era superior a 30 [de preferência 40], já considerávamos normal. No caso do POSCOMP, é normal sossegado !

    Curtir

  3. Ah: outra coisa legal de fazer é usar o parâmetro 1 onde vc colocou 0, na função do Excel/OpenOffice; isso nos fornece a distribuição cumulativa, ou seja, se sua nota foi X, a distribuição cumulativa mostra a probabilidade de notas inferiores a X. Se alguém tirou 35 nessa prova, por exemplo, está entre os 8% melhores hehehe…

    Curtir

  4. Apenas um comentário sobre o que foi dito acima. Uma distribuição é normal não influenciada pelo tamanho, mas apenas pela sua forma. Um exemplo fácil de se perceber: distribuição das idades na população brasileira. Nós temos 200 milhões de pessoas e nem por isso é uma distribuição normal. A média de idade da população brasileira é perto de 20 anos, mas há mais pessoas com 1 ano de idade do que com 20. De fato o mesmo vale para qualquer idade menor do que 20 anos, ou seja, a distribuição não segue a classica forma de sino da distribuição normal.

    Com relação as notas do POSCOMP apenas a organização tem como saber se a distribuição desta prova foi próxima da normal ou não, mas na ausência de maiores informações sobre a distribuição a aposta na distribuição normal é sempre válida.

    Curtir

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s