1
resposta

[Dúvida] Distribuição normal na variável dependente

Para verificar se a variável dependente é normalmente distribuída para poder realizar a regressão, é necessário fazer um normaltest? E para verificar a simetria é necessário utilizar o skew mencionado acima? Ou podemos ter uma estimativa apenas vendo o gráfico?

1 resposta

Ei, Felipe! Tudo bom?

Sim, pode utilizar um teste estatístico como o normaltest do SciPy. Ele ajuda a determinar se a amostra segue uma distribuição normal.

Sobre verificar a simetria da distribuição, o coeficiente de assimetria (skewness) é uma boa métrica. Ele pode indicar se a distribuição é simétrica ou se possui uma cauda mais longa em um dos lados. Valores de skewness próximos de zero indicam uma distribuição simétrica, enquanto valores positivos ou negativos indicam assimetrias à direita, ou à esquerda, respectivamente.

Você também pode ter uma estimativa visual da normalidade e da simetria observando gráficos, por exemplo com os histogramas ou gráficos de densidade (como o distplot do Seaborn). Eles fornecem uma boa intuição sobre a forma da distribuição, mas é sempre bom confirmar com testes estatísticos.

No contexto da sua análise, se a variável dependente apresenta uma assimetria à direita, o que pode ser visualizado tanto no boxplot quanto no gráfico de distribuição de frequências. Isso pode impactar a modelagem de regressão, e transformações na variável podem ser necessárias para aproximá-la de uma distribuição mais simétrica.

Espero ter ajudado e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!