Faz sentido usar a função de correlação em variáveis binárias?
Faz sentido usar a função de correlação em variáveis binárias?
Olá Melise, tudo bem? Espero que sim!
Desculpe pela demora em retornar.
A correlação é uma medida utilizada puramente para valores numéricos, então tome muito cuidado para não transformar variáveis categóricas em números e utilizar a correlação de maneira inapropriada, uma vez que o cálculo conseguirá ser feito mas não terá interpretação que possa ser utilizada.
Há um caso onde pode ser utilizada a correlação entre uma variável dicotômica, também conhecida como variável binária, e uma variável numérica. Essa correlação é chamada de ponto-bisserial e é calculada da mesma forma que a correlação de Pearson. Mas ela só pode ser calculada entre uma variável binária e uma variável numérica, não entre duas variáveis binárias.
Essa variável binária precisa cobrir todos os casos possíveis, ou seja, um valor necessariamente exclui o resultado do outro. São exemplos: fumante/não fumante, tratamento/placebo, sim/não. Esses valores são transformados em 0 e 1 para efetuar o cálculo.
Espero que tenha tirado sua dúvida.
Estou à disposição. Bons estudos!