Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Intervalo de Confiança 95%

Olá! Tudo bem?

Já dei uma discutida com o ChatGPT, mas ainda não consegui entender... Minha dúvida é:
Ao calcular uma CDF eu estou calculando a probabilidade de um valor assumir o valores menores ou iguais ao meu Z superior, certo? O ponto é: se eu adoto um Z = 0,975, logo eu estaria obtendo uma probabilidade acumulada de 97.5%, não? Fico confuso, pois, ao meu ver ao calcular um IC 95% faria mais sentido os seguintes passos:

import numpy as np
import pandas as pd

media_amostra = 5050
std = 150
n = 20

cl = 0.95 # nível confiança
alpha = 1 - cl

z_lower = norm.ppf(alpha/2)
z_upper = norm.ppf(1 - alpha/2)
width = norm.cdf(z_upper) - norm.cdf(z_lower)

sigma_x = std / np.sqrt(n)

e = width * sigma_x

intervalo = (media_amostra - e, media_amostra + e)
print(intervalo)
# (np.float64(5018.136031320628), np.float64(5081.863968679372))

Está errado esse raciocínio? Se sim, qual o erro?
Desde já, agradeço pelo atenção e esclarecimento da equipe! Vocês são 10!

2 respostas
solução!

Olá, Pedro! Tudo bem?

Você está no caminho certo ao calcular o intervalo de confiança (IC) de 95%, mas parece que houve uma pequena confusão na interpretação dos passos. Vamos esclarecer isso.

Quando calculamos um intervalo de confiança de 95%, queremos encontrar os valores entre os quais esperamos que a média populacional esteja, com 95% de confiança. Para isso, usamos a distribuição normal padrão e encontramos os valores críticos de Z que correspondem a essa confiança.

No seu código, você corretamente calculou z_lower e z_upper usando norm.ppf(alpha/2) e norm.ppf(1 - alpha/2), que são os valores críticos para um IC de 95%. Esses valores são aproximadamente -1.96 e 1.96, respectivamente. Isso significa que 95% da distribuição normal está entre esses dois valores de Z.

O erro no seu raciocínio está na tentativa de usar norm.cdf(z_upper) - norm.cdf(z_lower) para calcular a largura do intervalo. Na verdade, para calcular o erro padrão do intervalo de confiança, você deve usar apenas o valor crítico superior (ou inferior, já que são simétricos) multiplicado pelo erro padrão da média amostral.

O cálculo correto do erro padrão do intervalo de confiança seria:

sigma_x = std / np.sqrt(n)
e = z_upper * sigma_x

E então, o intervalo de confiança é calculado como:

intervalo = (media_amostra - e, media_amostra + e)

Utilizar z_upper (≈ 1,96 para um IC de 95%) como multiplicador do erro-padrão garante que o intervalo resultante se estenda exatamente o suficiente para cobrir a área central de 95% da distribuição normal.

Espero ter ajudado.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Entendi, Monalisa! Muito obrigado!