**Dados **
df_techtaste = pd.DataFrame({'avaliacoes': [38, 44, 33, 42, 47, 33, 36, 39, 42, 36, 39, 34, 42, 42, 36, 43, 31, 35, 36, 41, 42, 30, 25, 38, 47, 36, 32, 45, 44, 45, 37, 48, 37, 36, 44, 49, 31, 45, 45, 40, 36, 50, 38, 34, 36, 42, 46, 49, 36, 34, 38, 31, 53, 40, 57, 40, 36, 42, 26, 50, 32, 43, 35, 37, 42, 30, 36, 43, 40, 43, 44, 52, 37, 51, 35, 47, 40, 50, 37, 49]})
1. Calcule o desvio padrão amostral das avaliações.``
dpa = df_techtaste['avaliacoes'].std()
print(f'O desvio padrão amostral dos dados é de: {dpa}')
Saída: O desvio padrão amostral dos dados é de: 6.421827887581659
2. Calcule o erro padrão amostral da média para as avaliações dos clientes.
from scipy import stats
epa = stats.sem(df_techtaste['avaliacoes'])
print(f'O erro padrão amostral dos dados é de: {epa}')
Saída: O erro padrão amostral dos dados é de: 0.7179821848218233
3. Utilizando um gráfico de histograma, analise visualmente a distribuição das avaliações dos clientes.
plt.hist(df_techtaste['avaliacoes'], alpha=0.7, color='blue')
plt.title('Distribuição das Avaliações dos Clientes')
plt.xlabel('Notas')
plt.ylabel('Frequência')
plt.show()
Saída:
4. Observe o formato da distribuição gerado no histograma. Ele se assemelha a uma distribuição normal?
import seaborn as sns
plt.figure
sns.histplot(df_techtaste['avaliacoes'], kde=True, color='blue', bins=10)
plt.title('Distribuição das Avaliações dos Clientes')
plt.xlabel('Avaliações')
plt.ylabel('Densidade')
plt.show()
Saída:
O gráfico indica que as pontuações dos testes têm uma distribuição normal, com as notas perto da média e um formato de sino.
5. Com um nível de confiança de 90%, calcule o intervalo de confiança para a média das avaliações.
confianca = 0.90
media = df_techtaste['avaliacoes'].mean()
intervalo_confianca = stats.norm.interval(confianca,
loc=media ,
scale=epa)
print(f'Intervalo de Confiança (90%): {intervalo_confianca}')
Saída: Intervalo de Confiança (90%): (38.84402439920928, 41.205975600790715)
6. A largura do intervalo de confiança seria afetada se o nível de confiança fosse aumentado para 95%?
confianca = 0.95
media = df_techtaste['avaliacoes'].mean()
intervalo_confianca = stats.norm.interval(confianca,
loc=media ,
scale=epa)
print(f'Intervalo de Confiança (95%): {intervalo_confianca}')
Saída: Intervalo de Confiança (95%): (38.617780776207844, 41.43221922379215)