Solucionado (ver solução)
Solucionado
(ver solução)
4
respostas

Aula: Estabelecendo um intervalo de confiança

Boa tarde !

Quando criei o intervalo de confiança e utilizei o print, os dados mostraram foi uma lista de valores e nao os valores mínimo e máximo do intervalo de confiança como no video.

Meu código.

from scipy import stats
confianca = 0.95
media = dados_vida_lampada['duracao']
desvio_padrao_amostral = dados_vida_lampada['duracao'].std()
tamanho_amostra =len(dados_vida_lampada)
intervalo_confianca = stats.norm.interval(confianca, loc = media, scale = desvio_padrao_amostral/np.sqrt(tamanho_amostra))
print('IC (95%):', intervalo_confianca)

Resultado:

IC (95%): (array([ 2.16503276e+03,  3.31045397e+02,  2.84596433e+02,  2.12003417e+03,
        9.98948505e+02,  2.22871426e+03,  1.16817754e+03,  2.09635557e+03,
        1.21872559e+03,  3.09885338e+03,  4.43454702e+02,  1.60756861e+03,
        7.97156653e+02,  1.48060528e+03,  3.00705412e+03,  1.62381492e+03,
        5.48907213e+03,  1.37157119e+03,  4.05322418e+02,  2.38634016e+03,
        1.64668175e+03,  4.43373157e+02,  3.56330478e+02,  8.88602331e+02,
        5.08449209e+02,  7.81496896e+02,  3.62433896e+03,  1.78575639e+03,
        1.81017877e+03,  2.53894459e+03,  2.60428249e+03,  1.57449314e+03,....

Não entendi porque meus valores deram diferente.

Outra duvida, porque utilizase o loc= media. No caso, qual a função do loc nesse caso ?

Atenciosamente,

Rodrigo Bertini.

4 respostas

Oii Rodrigo, tudo bem?

Você poderia me falar certinho qual a aula em que está esse teste, por favor?

Aguardo!

oi Larissa,

Aula 08 - "Estabelecendo um intervalo de confiança" do modulo 1 - "Conhecendo a metodologia".

solução!

Oi, Rodrigo!

Sua saída está diferente porque você atribui à variável media toda a coluna 'duracao' do seu DataFrame, o que significa que você está passando um array de valores para a função stats.norm.interval. Para corrigir, é necessário aplicar a função da média ao array, assim:

media = dados_vida_lampada['duracao'].mean()

Já sobre sua segunda pergunta, a respeito do parâmetro loc, vamos observar a função stats.norm.interval:

stats.norm.interval(confianca,
                                       loc=media ,
                                       scale=desvio_padrao_amostral/np.sqrt(tamanho_amostra))

Essa função é usada para calcular o intervalo de confiança para a média da amostra assumindo uma distribuição normal.

O loc é o parâmetro que recebe a média, uma medida essencial para o cálculo matemático do intervalo de confiança.

O intervalo de confiança é construído em torno da média da amostra, assumindo que a média da amostra é a melhor estimativa da média populacional. Portanto, a média serve como o ponto central do intervalo de confiança.

Explore a documentação para conhecer melhor os parâmetros e a fórmula matemática utilizada.

Espero ter esclarecido.

Abraços!

Caso este post tenha lhe ajudado, por favor, marque como solucionado ✓. Bons Estudos!

Ola Larissa,

Muito obrigado, veio um array de valores não tinha percebido que faltava calcular a média da variável.

Entendi sobre o uso do LOC, muito obrigado !!

Abraço !