1
resposta

Mão na massa: Desenvolvimento

Utilizei o seguinte código para fazer o exercício:

import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats

# Conjunto de dados TechTaste
df_techtaste = pd.DataFrame({'avaliacoes': [38, 44, 33, 42, 47, 33, 36, 39, 42, 36, 39, 34, 42, 42, 36, 43, 31, 35, 36, 41, 42, 30, 25, 38, 47, 36, 32, 45, 44, 45, 37, 48, 37, 36, 44, 49, 31, 45, 45, 40, 36, 50, 38, 34, 36, 42, 46, 49, 36, 34, 38, 31, 53, 40, 57, 40, 36, 42, 26, 50, 32, 43, 35, 37, 42, 30, 36, 43, 40, 43, 44, 52, 37, 51, 35, 47, 40, 50, 37, 49]})

#===============================================================
# Questões 01 e 02 - Calculando o desvio padrão e o erro padrão
#===============================================================
desvio_padrao=df_techtaste['avaliacoes'].std()
erro_padrao=desvio_padrao/len(df_techtaste['avaliacoes'])
print("Desvio padrão:", desvio_padrao)
print("Erro padrão:", erro_padrao)

#===============================================================
# Questões 03 e 04 - Histograma
#===============================================================
plt.hist(df_techtaste, alpha=0.7, color='purple')
plt.title('Avaliações de clientes')
plt.xlabel('Nota de avaliação')
plt.ylabel('Frequência')
plt.show()
# Comentário:
# Visualmente os dados lembram uma distribuição normal

#==========================================================================
# Questão 05 - Cálculo do intervalo de confiança para uma confiança de 90%
#==========================================================================
media = df_techtaste['avaliacoes'].mean()
confianca = 0.90
intervalo_confianca=stats.norm.interval(
    confianca,
    loc=media,
    scale = erro_padrao)
print("IC (90%):", intervalo_confianca)

#==========================================================================
# Questão 05 - Cálculo do intervalo de confiança para uma confiança de 95%
#==========================================================================
confianca = 0.95
intervalo_confianca=stats.norm.interval(
    confianca,
    loc=media,
    scale = erro_padrao)
print("IC (95%):", intervalo_confianca)
# Comentário:
# O intervalo de confiança se altera muito pouco mudando a confiança de 90 para 95%.

Os resultados são os seguintes:

Questões 01 e 02

Desvio padrão: 6.421827887581659 Erro padrão: 0.08027284859477074

Questões 03 e 04

Histograma das notas de avaliação dos clientesQuestão 05

IC (90%): (np.float64(39.892962913843164), np.float64(40.15703708615683))

Questão 06

IC (95%): (np.float64(39.86766810781781), np.float64(40.182331892182184))

1 resposta

Ei, Adailton! Tudo bem?

Ótimo trabalho na atividade! Testei o código e está certinho com o que é pedido na atividade.

Sobre os intervalos de confiança, você notou que a mudança de 90% para 95% não alterou muito os valores, o que faz sentido, pois a amplitude aumenta conforme a confiança, mas seu impacto depende da variabilidade dos dados.

Continue se dedicando aos estudos e qualquer dúvida, compartilhe no fórum.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!