1
resposta

[Projeto] Mão na massa: testes paramétricos

**Caso 1: **

  • Defina a natureza das amostras. Temos um caso de amostra independente ou pareada?
    -Amostra pareada

  • Formule uma hipótese para o primeiro caso da Zoop Megastore.

#hipotese_nula = 0
#hipotese_alternativa != 0

Código:

import pandas as pd

#importando biblioteca para testes pareados
from scipy.stats import ttest_rel

df_equipe_vendas = pd.DataFrame({'Vendedor': [ 'Luíza', 'Bia', 'Rodrigo', 'Allan', 'Evaldo'],
                                 'Vendas Antes (R$)': [252.72, 203.91, 307.32, 185.78, 220.5],
                                 'Vendas Depois (R$)': [285.1, 223.15, 324.41, 202.23, 240.63]})

#calculando variação das vendas
df_equipe_vendas['Variacao Vendas'] = [b - a for a, b in zip(df_equipe_vendas['Vendas Antes (R$)'], df_equipe_vendas['Vendas Depois (R$)'])]

#visualizando variação das vendas
df_equipe_vendas['Variacao Vendas']

stats, p_valor = ttest_rel(df_equipe_vendas['Vendas Depois (R$)'], df_equipe_vendas['Vendas Antes (R$)'])

nivel_significancia = 0.05

if p_valor < nivel_significancia:
    print("Rejeitar a hipótese nula")
else:
    print("Não rejeita hipótese nula")

Rejeitar a hipótese nula

#visualizando gráfico de comparação das vendas

import matplotlib.pyplot as plt

plt.plot(df_equipe_vendas['Vendas Depois (R$)'], label = 'Vendas Depois (R$)')
plt.plot(df_equipe_vendas['Vendas Antes (R$)'], label = 'Vendas Antes (R$)')
plt.legend()
plt.show()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Caso 2:

  • Defina a natureza das amostras. Temos um caso de amostra independente ou pareada?
    -Amostra independente
  • Formule uma hipótese para o segundo caso da Zoop Megastore.
    Hipótese nula: média da filial Centro-Norte = média da filial Sul
    Hipótese alternativa: média da filial Centro-Norte != média da filial Sul

Código:

import pandas as pd
from scipy.stats import ttest_ind

df_filiais = pd.DataFrame({'Filial Centro-Norte': [3.2, 2.9, 2.0, 3.3, 3.1],
                           'Filial Sul': [3.8, 4.0, 4.7, 4.9, 4.8]})
                           
#visualizando médias						  
print(f'Médias do Centro-Norte: {df_filiais['Filial Centro-Norte'].mean():.2f}\nMédias do Sul: {df_filiais['Filial Sul'].mean():.2f}')

#visualizando notas de satisfação
plt.hist(df_filiais['Filial Centro-Norte'], color = 'blue', alpha = 0.5, label = 'Centro-Norte')
plt.hist(df_filiais['Filial Sul'], color = 'green', alpha = 0.5, label = 'Sul')
plt.ylabel('Distribuição')
plt.xlabel('Nota de satisfação')
plt.legend()
plt.show()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

stats, p_valor = ttest_ind(df_filiais['Filial Centro-Norte'], df_filiais['Filial Sul'])
print(p_valor)

nivel_significancia = 0.05

if p_valor < nivel_significancia:
    print("Rejeitar a hipótese nula")
else:
    print("Não rejeita hipótese nula")

Rejeitar a hipótese nula

1 resposta

Oii Vinicius, tudo bem?

Obrigada por compartilhar sua solução aqui no fórum! Você estruturou os dois casos muito bem: identificou corretamente o tipo de amostra em cada situação, formulou as hipóteses de forma clara e escolheu o teste adequado para cada cenário (ttest_rel para amostras pareadas e ttest_ind para independentes). Isso mostra que você entendeu a lógica por trás da escolha do teste, não só a aplicação mecânica.

Um detalhe bacana que vale mencionar: você calculou a variação das vendas no Caso 1 antes de rodar o teste, o que ajuda bastante na interpretação visual dos dados. E a visualização com o histograma no Caso 2 complementa bem a análise, deixando clara a diferença entre as distribuições das duas filiais.

Conte com a Alura para evoluir seus estudos. Em caso de dúvidas, fico à disposição.

Bons estudos!

Sucesso

Imagem da comunidade