import pandas as pd
from scipy import stats
Conjunto de dados Techsafe (n=25)
df_techsafe = pd.DataFrame({'porcentagem_compressao': [21.99342831, 20.7234714 , 22.29537708, 24.04605971, 20.53169325, 20.53172609, 24.15842563, 22.53486946, 20.06105123, 22.08512009, 20.07316461, 20.06854049, 21.48392454, 17.17343951, 17.55016433, 19.87542494, 18.97433776, 21.62849467, 19.18395185, 18.1753926, 23.93129754, 20.5484474 , 21.13505641, 18.15050363, 19.91123455]})
Etapa 2: Média amostral
media_amostral = df_techsafe['porcentagem_compressao'].mean()
Etapa 3: Nível de Confiança e Significância
confianca = 0.95
nivel_significancia = 1 - confianca # 0.05
Etapa 4: Teste t (Unicaudal à direita, pois queremos testar se é SUPERIOR a 20)
media_hipotetica = 20
t_stat, p_valor = stats.ttest_1samp(df_techsafe['porcentagem_compressao'],
popmean=media_hipotetica,
alternative='greater')
print(f"Média Amostral: {media_amostral:.4f}%")
print(f"Estatística t: {t_stat:.4f}")
print(f"p-valor: {p_valor:.4f}")
Com apenas 25 arquivos, não podemos confirmar o anúncio de marketing. Recomenda-se aumentar o tamanho da amostra para obter um teste com maior poder estatístico!