import pandas as pd
import numpy as np
df_equipe_vendas = pd.DataFrame({'Vendedor': [ 'Luíza', 'Bia', 'Rodrigo', 'Allan', 'Evaldo'],
'Vendas Antes (R$)': [252.72, 203.91, 307.32, 185.78, 220.5],
'Vendas Depois (R$)': [285.1, 223.15, 324.41, 202.23, 240.63]})
1°) Qual a relação entre as amostras?
R: Se tratam de amostras pareadas, pois o mesmo grupo de funcionários será avaliado após o programa de treinamento.
media_vendas_antes = np.mean(df_equipe_vendas['Vendas Antes (R$)'])
media_vendas_depois = np.mean(df_equipe_vendas['Vendas Depois (R$)'])
print(f'----Média das vendas----\n Antes do Treinamento: {media_vendas_antes:.2f}\n Depois do Treinamento: {media_vendas_depois:.2f}')
Hipóteses formuladas:
H0: μd=0
H1: μd>0
Obs: μd representará a diferença entre as médias.
from scipy.stats import ttest_rel
stats, p_valor = ttest_rel(df_equipe_vendas['Vendas Antes (R$)'], df_equipe_vendas['Vendas Depois (R$)'], alternative='greater')
nivel_sig = 0.05
print(f'Resultados:\n\nEstatística de teste: {stats}\nP-valor: {p_valor}')
if p_valor < nivel_sig:
result = 'Rejeitar a hipótese nula.'
else:
result = 'Aceitar a hipótese nula.'
print(f'Resultado: {result}')
Segundo Caso: Análise de satisfação dos clientes.
import pandas as pd
df_filiais = pd.DataFrame({'Filial Centro-Norte': [3.2, 2.9, 2.0, 3.3, 3.1],
'Filial Sul': [3.8, 4.0, 4.7, 4.9, 4.8]})
Qual a relação entre as amostras?
As duas amostras são independentes, haja vista que os clientes das duas filiais não possuem relação.
Hipóteses consideradas.
H_0: μd=0
H_1: μd != 0
from scipy import ttest_rel
stats, p_valor = ttest_rel(df_filiais['Filial Centro-Norte'], df_filiais['Filial Sul'])
print(f'Resultado do teste T bilateral.\n\nEstatística de teste:{stats:.2f}\nP-Valor:{p_valor}')
nivel_sig = 0.05
if stats < nivel_sig:
result = 'Rejeitar a hipótese nula.'
else:
result = 'Aceitar a hipótese nula.'
print(f'Resultado: {result}')