Fala galera, beleza?
Queria entender melhor os valores que resultam o ranksums().
No exercício fala: O p-value representa a probabilidade daquela amostra ter acontecido dentro da população. Se a chance é pequena, geralmente p-value < 0,05, representa que um evento muito raro aconteceu, então optamos por descartar a hipótese nula, e dizer que ela pode não ser verdade.
Hipótese Nula = A distribuição da taxa da gorjeta é a mesma nos dois grupos.
Hipótese Alternativa = A distribuição da taxa da gorjeta não é a mesma nos dois grupos.
Eu estou comparando
sobremesa = dados.query('sobremesa == "Sim"').porcentagem
sem_sobremesa = dados.query('sobremesa == "Não"').porcentagem
ranksums(sobremesa,sem_sobremesa)
Resultado:
RanksumsResult(statistic=-0.6331073145314825, pvalue=0.5266635660124415)
Primeira dúvida, na função se eu inverto os valores a única coisa que muda é o sinal do statistic.
O que representa esse statistic?
Segunda dúvida, já que não fez diferença eu inverter os campos das amostras, como sei que estou querendo saber se sobremesa ou sem_sobremesa é um evento raro?
Li alguns artigos mas ainda não consegui pegar bem.
Poderiam em ajudar?