import pandas as pd
import numpy as np
# Conjunto de dados Techsafe
df_techsafe = pd.DataFrame({'porcentagem_compressao': [21.99342831, 20.7234714 , 22.29537708, 24.04605971, 20.53169325, 20.53172609, 24.15842563, 22.53486946, 20.06105123, 22.08512009, 20.07316461, 20.06854049, 21.48392454, 17.17343951, 17.55016433, 19.87542494, 18.97433776, 21.62849467, 19.18395185, 18.1753926, 23.93129754, 20.5484474 , 21.13505641, 18.15050363, 19.91123455]})
Formule uma hipótese para o caso da Techsafe.
#estabelecendo hipoteses
H0: μ = 20
H1: μ > 20
Calcule a média amostral dos dados.
media_amostral = df_techsafe['porcentagem_compressao'].mean()
print(f'Média amostral:{media_amostral}')
Estabeleça um nível de confiança para o problema e calcule o nível de significância.
# nivel de confiança
confianca = 0.95
nivel_significancia = 1 - confianca
print(f'Nível de significância: {nivel_significancia}')
Utilize o Teste t para calcular o valor da estatística t e o p-valor para o problema da Techsafe, mostre os dados.
# teste t unilateral para uma amoestra
from scipy.stats import ttest_1samp
stats, p_valor = ttest_1samp(df_techsafe, 20, alternative = 'greater')
print(f'Estatística t: {stats}')
print(f'Valor-p: {p_valor}')
Pelos resultados anteriores, a hipótese nula formulada é rejeitada ou não rejeitada? Explique o que justifica sua decisão.
if p_valor < nivel_significancia:
conclusao = 'Rejeitar a hipótese nula'
else:
conclusao = 'Não rejeitar a hipótese nula'
print(f'Decisão: {conclusao}')
O p-valor foi menor que o nível de significância 0.5, por isso rejeitamos a hipótese nula.