Prezados, se a amostra do projeto final é de trabalhadores, o mais razoável é que se considere a renda > 0, certo? Se for assim o resultado muda, sim ou não? Segue o código:
rj = dados.query('UF == 33 and Renda > 0').sample(n = 500, random_state = 101).Renda
sp = dados.query('UF == 35 and Renda > 0').sample(n = 500, random_state = 101).Renda
significancia = 0.05
confianca = 1 - significancia
n_rj = 500
n_sp = 500
D_0 = 0
z_alpha = norm.ppf(probabilidade)
z_alpha.round(2)
-1.64
numerador = (media_amostra_rj - media_amostra_sp) - D_0
denominador = np.sqrt((desvio_padrao_amostra_rj ** 2 / n_rj) + (desvio_padrao_amostra_sp ** 2 / n_sp))
z = numerador / denominador
z
0.8743012705687867
z <= z_alpha
False
z, p_valor = test_A.ztest_ind(alternative='smaller', value=0)
print('Estatística z ->', z)
print('p-valor ->', p_valor)
Estatística z -> 0.8743012705687829
p-valor -> 0.8090228962065803
z, p_valor = test_B.ztest_ind(alternative='smaller', value=0)
print('Estatística z ->', z)
print('p-valor ->', p_valor)
Estatística z -> 0.8743012705687829
p-valor -> 0.8090228962065803
p_valor <= significancia
False