Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Projeto] Exercício e sugestão Google Colab

Foi ótimo rever estes conceitos. Ainda me bato um pouco com as importações dos módulos no Python, mas aos poucos vamos chegando lá. Uma dica que talvez ajude a quem - assim como eu - gosta de manter as documentações abertas enquanto trabalha é selecionar a opção "Visualização de uma guia" no colab ;) Imagem com o caminho do layout de pagina para guias no google colab

Segue minha resolução proposta:

import pandas as pd
import numpy as np
from scipy import stats

Conjunto de dados TechTaste

df_techtaste = pd.DataFrame({'avaliacoes': [38, 44, 33, 42, 47, 33, 36, 39, 42, 36, 39, 34, 42, 42, 36, 43, 31, 35, 36, 41, 42, 30, 25, 38, 47, 36, 32, 45, 44, 45, 37, 48, 37, 36, 44, 49, 31, 45, 45, 40, 36, 50, 38, 34, 36, 42, 46, 49, 36, 34, 38, 31, 53, 40, 57, 40, 36, 42, 26, 50, 32, 43, 35, 37, 42, 30, 36, 43, 40, 43, 44, 52, 37, 51, 35, 47, 40, 50, 37, 49]})

Calcule a média amostral das avaliações.

media_techtaste = df_techtaste['avaliacoes'].mean()
print(media_techtaste)

#Formule hipóteses para o problema da empresa. #H0:μ=30, H1:μ≠30

#Estabelecidos o nível de confiança em 95% e o desvio padrão populacional em 2.65, verifique se a média da amostra está definida dentro do intervalo de confiança da hipótese nula.

confianca = 0.95
dp_populacional = 2.65
tamanho_amostra = len(df_techtaste['avaliacoes'])


intervalo_confianca = stats.norm.interval(confianca,
                                       loc=30 ,
                                       scale=(dp_populacional)/np.sqrt(tamanho_amostra))

print(f'IC (95%): {intervalo_confianca}')

#O que é possível entender a partir do resultado da etapa anterior?

Temos um argumento para rejeitar H0 já que o valor médio da amostra não se encontra dentro dos limites, considerando um intervalo de confianca de 0.95.

#Utilize o Teste Z para calcular o valor da Estatística Z e o p-valor para o problema da TechTaste.

from statsmodels.stats.weightstats import ztest

stat, p_valor = ztest(x1=df_techtaste['avaliacoes'], value= 30, alternative='two-sided')

print(f"Estatística Z: {stat}") # quantos desvios padrões estão acima/abaixo da média assumida
print(f"Valor-p: {p_valor}")

#Pelos resultados anteriores, a hipótese nula formulada é rejeitada ou não rejeitada? Explique o que justifica sua decisão.

Rejeitada. Os resultados indicam que podemos rejeitar a hipótese nula de que a média das avaliações é 30.

Pelo valor-p ser um numero MUITO baixo, muito menor que 0,05(intervalo de significância), isso indica uma probabilidade extremamente baixa de obter uma média de 30 nas avaliações.

1 resposta
solução!

Oii, Estudante!

Excelente, parabéns por colocar em prático o conhecimento que vem adquirindo! E obrigada por compartilhar com os demais aqui no fórum, com certeza será de grande ajuda e inspiração.

Continue assim, se dedicando e praticando. Caso tenha dúvidas, compartilhe no fórum, estaremos por aqui para te ajudar.

Bons estudos!