No vídeo 4 do segundo módulo do curso "Data Science: testanto hipóteses" temos o objetivo de definir se algumas lâmpadas têm sua média de duração = 1570 horas (nossa hipótese nula).
Calculando a média da duração dos dados que temos (média observada), vimos que ela é igual a 1521.
Calculando o intervalo de confiança da seguinte maneira:
#informações para a região crítica
confianca = 0.95
desvio_padrao_populacional = 105
tamanho_amostra = len(lampadas_natalinas)
#calculando o IC
intervalo = stats.norm.interval(confianca,
loc = 1570,
scale = desvio_padrao_populacional / np.sqrt(tamanho_amostra))
Verificou-se que o intervalo de confiança estaria entre 1532 e 1607 horas.
Nesse caso, a média observada de 1521 horas está fora desse intervalo. Mas, a nossa hipótese nula está sim dentro (1570).
Na aula foi dito que pelo fato da média observada de 1521 estar fora do intervalo (1532 a 1607) que verificamos, deveríamos rejeitar a hipótese nula.
Mas, não estamos verificando se a hipotése nula está dentro do intervalo? Descobrimos que sim. E, afinal, não foi estabelecido que temos 95% de confiança de que o valor real da média de duração está entre 1532 e 1607? Qual a lógica de rejeitar a hipótese nula então?
Faz sentido?