Dados
df_techtaste = pd.DataFrame({'avaliacoes': [38, 44, 33, 42, 47, 33, 36, 39, 42, 36, 39, 34, 42, 42, 36, 43, 31, 35, 36, 41, 42, 30, 25, 38, 47, 36, 32, 45, 44, 45, 37, 48, 37, 36, 44, 49, 31, 45, 45, 40, 36, 50, 38, 34, 36, 42, 46, 49, 36, 34, 38, 31, 53, 40, 57, 40, 36, 42, 26, 50, 32, 43, 35, 37, 42, 30, 36, 43, 40, 43, 44, 52, 37, 51, 35, 47, 40, 50, 37, 49]})
1 - Calcule a média amostral das avaliações.
media_avaliacoes = (df_techtaste['avaliacoes']).mean()
print(f'O valor da média amostral das avaliações é de: {media_avaliacoes}')
Saída: O valor da média amostral das avaliações é de: 40.025
2 - Formule hipóteses para o problema da empresa.
hipotese_nula: media = 30
hipotese_alternativa: media != 0
3 - Estabelecidos o nível de confiança em 95% e o desvio padrão populacional em 2.65, verifique se a média da amostra está definida dentro do intervalo de confiança da hipótese nula.
confianca = 0.95
desvio_padrao_populacional = 2.65
tamanho_amostra = len(df_techtaste['avaliacoes'])
intervalo_confianca = stats.norm.interval(confianca,
loc=30 ,
scale=(desvio_padrao_populacional)/np.sqrt(tamanho_amostra))
print(f'Intervalo de Confiança (95%): {intervalo_confianca}')
Saída: Intervalo de Confiança (95%): (29.419303816868016, 30.580696183131984)
4 - O que é possível entender a partir do resultado da etapa anterior?
Como o valor da média das avaliações está fora do intervalo de confiança, temos um argumento para rejeitar a hipótese nula.
5 - Utilize o Teste Z para calcular o valor da Estatística Z e o p-valor para o problema da TechTaste.
stat, p_valor = ztest(x1=df_techtaste['avaliacoes'], value= 30, alternative='two-sided')
print(f"Estatística Z: {stat}") # quantos desvios padrões estão acima/abaixo da média assumida
print(f"Valor-p: {p_valor}")
Saída: Estatística Z: 13.96274198988354 Valor-p: 2.6311293593122384e-44
6. Pelos resultados anteriores, a hipótese nula formulada é rejeitada ou não rejeitada? Explique o que justifica sua decisão.
Os resultados indicam que podemos rejeitar a hipótese nula de que a média das avaliações é 30. Podemos concluir isso pois o valor-p é muito menor que 0,05, o que indica uma probabilidade extremamente baixa de obter uma média de 30 nas avaliações.