Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Faça como eu fiz na aula: padronizando a coluna valor da venda.

Só um comentário: No exemplo resolvido pelo instrutor, ele calculou o Desvio Padrão da População (Função DESVPAD.P) e se usarmos o Desvio Padrão Amostral (DESVPAD.A) resultam em uma pequena diferença que afeta também os resultados da coluna "Valor da Venda Padronizado".

1 resposta

Olá, Márcio. Como vai?

Sua observação é brilhante e toca no cerne da precisão analítica dentro da Ciência de Dados e da Estatística! Você está totalmente correto: o uso de DESVPAD.P (Populacional) versus DESVPAD.A (Amostral) altera o denominador do cálculo e, consequentemente, impacta o resultado de qualquer padronização subsequente, como o cálculo do Score-Z.

Para deixar claro o motivo de o Excel gerar esses números diferentes e ajudar a consolidar quando usar cada um no dia a dia, vale a pena entender o que acontece por trás das fórmulas:

  • DESVPAD.P (População): É usado quando você tem em mãos a totalidade absoluta dos dados daquele cenário. Se a sua planilha contém todas as vendas realizadas pela empresa em sua história (ou no período completo avaliado), o instrutor utilizou a fórmula certa, pois não há extrapolação a ser feita. O cálculo divide a soma dos desvios pelo número total de elementos ($N$).
  • DESVPAD.A (Amostra): É usado quando os dados da planilha são apenas uma "fatia" ou amostragem de um universo muito maior. Para corrigir o fato de que uma amostra tende a subestimar a real variabilidade da população, a fórmula aplica a Correção de Bessel, dividindo pelo número de elementos menos um ($n - 1$).

Como o denominador da fórmula amostral ($n - 1$) é menor, o resultado do Desvio Padrão Amostral sempre será ligeiramente maior do que o populacional.

Ao aplicar a padronização do valor da venda (Score-Z), a fórmula utilizada na célula do Excel é:

= (Valor_da_Venda - Média) / Desvio_Padrão

Como o desvio padrão fica no denominador dividindo a conta, se você usar o desvio amostral (que é maior), o "Valor da Venda Padronizado" final ficará sutilmente menor (mais próximo de zero) em comparação ao método populacional.

A regra de ouro prática para os seus próximos projetos no Excel é: se os dados representam um teste, uma pesquisa parcial ou um recorte de tempo, use sempre as funções amostrais (DESVPAD.A e VAR.A). Se representam o censo completo do cenário, vá de populacional (DESVPAD.P e VAR.P).

Parabéns pelo olhar técnico aguçado e por perceber esses detalhes que mudam o resultado dos modelos analíticos!

Espero que possa ter lhe ajudado!