Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Desvio padrão amostral ou populacional?

Olá! Por padrão, a função .std do Pandas retorna o desvio padrão amostral, certo? Não ficou claro pra mim quando utilizar o amostral ou o populacional.

2 respostas
solução!

Olá, Mariana! Tudo bom?

O pandas.DataFrame.std retorna o desvio padrão amostral sim, perfeito.

Nós devemos utilizar o std para amostras quando sabemos que a base de dados avaliada representa apenas um fragmento, ou uma amostra de um conjunto de dados maior. Podemos utilizar como exemplo uma escola, onde se nós avaliarmos dados sobre apenas um grupo de alunos (pode ser uma sala), nós estaremos inferindo informações apenas de uma parte de um todo, no exemplo seria a escola inteira. Nem sempre nós conseguimos trabalhar com toda a população (o conceito estatístico), então nós consideramos uma amostra representativa do nosso conjunto e executamos as análises.

Resumo:

  • Se os dados avaliados são apenas um subconjunto / amostra / fragmento de um conjunto maior, nós consideramos o desvio amostral
  • Se os dados avaliados são todo o conjunto, onde não há espaço para margem de erros, nós usamos o desvio populacional

A diferença é bem sutil entre as duas fórmulas, o que muda é o denominador entre ser N, para o populacional, e N - 1, para o amostral. E essa diferença é uma correção de viés chamada Correção de Bessel, que visa ser um pouco mais precisa. Isso não invalida totalmente os resultados usando um desvio amostral.

Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Não é necessário fechar o tópico, outras pessoas podem ser ajudadas por ele :D

Entendi, muito obrigada Marcus!