Olá colegas!
Na aula 08 - Distribuição de frequências, o instrutor Rodrigo Dias considera que, para fins de aprendizagem, mesmo que visualmente a distribuição seja levemente deformada, assume-se que o conjunto de dados segue uma distribuição normal. Ele cita testes formais para a verificação dessa normalidade do conjunto, dessa forma investiguei que:
Teste de normalidade via normaltest
Hipótese nula: this function tests the null hypothesis that a sample comes from a normal distribution. https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html
from scipy.stats import normaltest
stats, p_valor = normaltest(dados['consumo']) # Retorna dois outputs, no caso aqui queremos só o p-value
print(p_valor)
0.019678437769899134
if p_valor <= 0.05:
print('Hipótese nula (H0) rejeitada. A distribuição do conjunto não segue uma distribuição normal.')
else:
print('Hipótese nula (H0) aceita. A distribuição do conjunto segue uma distribuição normal.')
output = Hipótese nula (H0) rejeitada. A distribuição do conjunto não segue uma distribuição normal.
Dessa forma é comprovado que, o conjunto de dados que o Rodrigo Dias utilizou não segue uma distribuição normal?