Por que usamos o módulo da estatística z para calcular o p_valor? Em p_valor = 2 * norm.sf(abs(z))
Por que usamos o módulo da estatística z para calcular o p_valor? Em p_valor = 2 * norm.sf(abs(z))
Olá, Fernando, tudo bem?
No teste de hipótese de duas caudas, estamos interessados em desvios extremos da hipótese nula em ambas as direções. Ou seja, consideramos tanto valores de z muito grandes quanto valores de z muito pequenos (negativos). Com isso, estamos dobrando a cauda da distribuição, permitindo que os desvios extremos em ambas as direções.
O "2 * norm.sf(abs(z))" é usado para calcular o p-valor para um teste de duas caudas. A função "sf" (ou "survival function") retorna a probabilidade de que uma variável aleatória com uma determinada distribuição seja maior que um determinado valor (neste caso, abs(z)). Multiplicar por 2 nos dá a probabilidade em ambas as extremidades da distribuição, ou seja, a probabilidade de que a variável aleatória seja maior que z ou menor que -z
Portanto, o valor absoluto do z, garantimos que estamos considerando a área em ambos os lados da distribuição, tornando o teste bicaudal.
Espero ter ajudado e fico à disposição.
Abraços e bons estudos!
Muito obrigado, Monalisa. Compreendi! Como temos que norm.cdf(-z) == norm.sf(+z), neste teste bicaudal, devemos utilizar a função de absoluto para garantir o uso correto da função sf().