1
resposta

Posso utilizar log para dados qualitativos?

Vejo que no exemplo você utiliza log para dados quantitativos, porém como faço se eu quiser analisar a relação entre fumantes = 1 e não fumantes = 0 com o gasto no hospital?

Neste caso estou analisando um dado quantitativo(gasto no hospital) com um dado qualitativo(fumantes e não fumantes). Suponhamos que quando aplico o distplot no gasto com hospital, o mesmo deu assimétrico à direita e pra corrigir isso aplico o log corrigindo a assimetria. Feito isso eu não sei o faço com o dado qualitativo. Posso aplicar o log nele também? Mantenho como está?

1 resposta

Oi Luana, tudo bem?

Na regressão linear, utilizamos o logaritmo para corrigir a assimetria dos dados quantitativos e obter uma distribuição mais próxima da normalidade. No entanto, o logaritmo não é aplicado a variáveis qualitativas, como fumantes e não fumantes.

No seu caso, você pode utilizar uma codificação adequada para representar a variável qualitativa "fumantes" e "não fumantes". Por exemplo, você pode atribuir o valor 1 para fumantes e o valor 0 para não fumantes. Dessa forma, você terá uma variável numérica que representa a presença ou ausência de fumantes.

Ao realizar a análise de regressão linear, você poderá incluir essa variável como um dos preditores do gasto no hospital. Assim, será possível verificar a relação entre a presença de fumantes e o gasto no hospital.

Lembre-se de interpretar corretamente os resultados da regressão, considerando o tipo de codificação utilizado para a variável qualitativa. Por exemplo, se o coeficiente da variável "fumantes" for positivo, isso indica que a presença de fumantes está associada a um maior gasto no hospital.

Um abraço e bons estudos.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software