Boa noite, tudo bem?
Fiquei meio confuso com a explicação e gostaria de entender se eu entendi certo ou estou errado!
Aula 1-6
No trecho:
media_das_medias = duracao_amostras['medias_duracao'].mean()
EP = duracao_amostras['medias_duracao'].std()
Se medias_duracao armazena médias de várias amostras de mesmo tamanho, então std() nessa coluna de fato estima o Erro Padrão da média (desvio da distribuição de médias). Seria legal explicitar isso na aula, pois pode parecer que é “só” o desvio padrão dos dados brutos, como como foi feito um bootstrap dos dados antes, pegado essas amostras do bootstrap, o desvio padrão realmente é o EP, mas isso não ficou claro na aula.
Aula 1-8
No cálculo do intervalo de confiança:
intervalo_confianca = stats.norm.interval(
confianca,
loc=media,
scale=desvio_padrao_amostral/np.sqrt(tamanho_amostra)
)
Aqui o parâmetro scale é o Erro Padrão (EP). Na explicação foi mencionado “variância”, mas variância é σ², enquanto o código usa σ/√n. A fórmula conceitual correta é IC = média amostral ± (valor crítico) × EP o código está certo, só a terminologia na explicação é que parece ter saído incorreta.
Sugestão o pandas possui Series.sem()/DataFrame.sem() para calcular o Erro Padrão diretamente, o que pode simplificar alguns trechos.
Espero que tenham me entendido e caso esteja equivocado por favor me ajudam
Obrigado e parabéns pelo conteúdo!