Utilizei o seguinte código para fazer o exercício:
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
# Conjunto de dados TechTaste
df_techtaste = pd.DataFrame({'avaliacoes': [38, 44, 33, 42, 47, 33, 36, 39, 42, 36, 39, 34, 42, 42, 36, 43, 31, 35, 36, 41, 42, 30, 25, 38, 47, 36, 32, 45, 44, 45, 37, 48, 37, 36, 44, 49, 31, 45, 45, 40, 36, 50, 38, 34, 36, 42, 46, 49, 36, 34, 38, 31, 53, 40, 57, 40, 36, 42, 26, 50, 32, 43, 35, 37, 42, 30, 36, 43, 40, 43, 44, 52, 37, 51, 35, 47, 40, 50, 37, 49]})
#===============================================================
# Questões 01 e 02 - Calculando o desvio padrão e o erro padrão
#===============================================================
desvio_padrao=df_techtaste['avaliacoes'].std()
erro_padrao=desvio_padrao/len(df_techtaste['avaliacoes'])
print("Desvio padrão:", desvio_padrao)
print("Erro padrão:", erro_padrao)
#===============================================================
# Questões 03 e 04 - Histograma
#===============================================================
plt.hist(df_techtaste, alpha=0.7, color='purple')
plt.title('Avaliações de clientes')
plt.xlabel('Nota de avaliação')
plt.ylabel('Frequência')
plt.show()
# Comentário:
# Visualmente os dados lembram uma distribuição normal
#==========================================================================
# Questão 05 - Cálculo do intervalo de confiança para uma confiança de 90%
#==========================================================================
media = df_techtaste['avaliacoes'].mean()
confianca = 0.90
intervalo_confianca=stats.norm.interval(
confianca,
loc=media,
scale = erro_padrao)
print("IC (90%):", intervalo_confianca)
#==========================================================================
# Questão 05 - Cálculo do intervalo de confiança para uma confiança de 95%
#==========================================================================
confianca = 0.95
intervalo_confianca=stats.norm.interval(
confianca,
loc=media,
scale = erro_padrao)
print("IC (95%):", intervalo_confianca)
# Comentário:
# O intervalo de confiança se altera muito pouco mudando a confiança de 90 para 95%.
Os resultados são os seguintes:
Questões 01 e 02
Desvio padrão: 6.421827887581659 Erro padrão: 0.08027284859477074
Questões 03 e 04
Questão 05
IC (90%): (np.float64(39.892962913843164), np.float64(40.15703708615683))
Questão 06
IC (95%): (np.float64(39.86766810781781), np.float64(40.182331892182184))