1
resposta

Mão na massa: testes paramétricos

Primeiro caso Zoop Megastore

import pandas as pd

df_equipe_vendas = pd.DataFrame({'Vendedor': [ 'Luíza', 'Bia', 'Rodrigo', 'Allan', 'Evaldo'],
                                 'Vendas Antes (R$)': [252.72, 203.91, 307.32, 185.78, 220.5],
                                 'Vendas Depois (R$)': [285.1, 223.15, 324.41, 202.23, 240.63]})

Defina a natureza das amostras. Temos um caso de amostra independente ou pareada?

# As amostras são pareadas pois foram coletadas apartir do mesmo grupo de trabalhadores e trabalhadoras em momentos diferentes.

Formule uma hipótese para o primeiro caso da Zoop Megastore.

# formulação de hipoteses
H0: μd = 0
H1: μd != 0

Aplique um teste paramétrico para tomar a decisão da hipótese.]

# teste de hipotese

from scipy.stats import ttest_rel

stats, p_valor = ttest_rel (df_equipe_vendas['Vendas Antes (R$)'], df_equipe_vendas['Vendas Depois (R$)'])
print(p_valor)

Pelos resultados anteriores, a hipótese nula formulada é rejeitada ou não rejeitada? Explique o que justifica sua decisão.

alpha = 0.05
if p_valor < alpha:
    print("Rejeitar a hipótese nula: Há evidências de que o treinamento tem um efeito positivo nas vendas.")
else:
    print("Não rejeita hipótese nula: Não há evidências suficientes para afirmar um efeito positivo nas vendas devido o treinamento.")
    
    # Rejeitar a hipótese nula: Há evidências de que o treinamento tem um efeito positivo nas vendas.

Segundo caso Zoop Megastore

import pandas as pd

df_filiais = pd.DataFrame({'Filial Centro-Norte': [3.2, 2.9, 2.0, 3.3, 3.1],
                           'Filial Sul': [3.8, 4.0, 4.7, 4.9, 4.8]})

Defina a natureza das amostras. Temos um caso de amostra independente ou pareada?

# As amostras são independentes pois as amostras foram coletadas de duas filias diferentes e não possuem nenhuma relação.

Formule uma hipótese para o segundo caso da Zoop Megastore.

# formulação de hipoteses

H0 : media filial centro-norte = media filial sul
H1 : media filial centro-norte != media filial sul

Aplique um teste paramétrico para tomar a decisão da hipótese.

#teste t para amostras independentes (ttest_ind)

from scipy.stats import ttest_ind

stats, p_valor = ttest_ind (df_filiais['Filial Centro-Norte'], df_filiais['Filial Sul'])
print(p_valor)

Pelos resultados anteriores, a hipótese nula formulada é rejeitada ou não rejeitada? Explique o que justifica sua decisão.

alpha = 0.05
if p_valor < alpha:
    print("Rejeitar a hipótese nula.")
else:
    print("Não rejeita hipótese nula.")

O resultado do p-valor foi menor que o nível de significância, por isso rejeitamos a hipótese nula.

1 resposta

Oi, Márcia! Tudo bom?

Excelente! Siga praticando com os desafios e sempre compartilhe conosco.

Você soube aplicar os testes paramétricos para diferentes naturezas de amostras de forma eficiente, aproveitou bem o ttest_rel() para comparar vendas antes/depois do treinamento e entendeu como o ttest_ind() é essencial para avaliar diferenças entre filiais independentes.

Como dica adicional, experimente utilizar o argumento equal_var=False no ttest_ind() quando suspeitar que as variâncias entre os grupos são diferentes. Assim:

stats, p_valor = ttest_ind(df_filiais['Filial Centro-Norte'], df_filiais['Filial Sul'], equal_var=False)

Um ajuste adequado quando as variâncias não são homogêneas.

Ícone de sugestão Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!