1
resposta

Transformação de variáveis

É possível aplicar duas transformações de variáveis em um conjunto de dados para construir um modelo de regressão linear? Por exemplo, aplicar uma transformação logaritmica nos dados (não categóricos), pois a distribuição da variável target é assimétrica à direta, e também transformar variáveis categóricas, que são importantes para o modelo, em variáveis dummy?

1 resposta

Olá, Ewerton! Tudo bem com você?

Peço desculpa pela demora em responder o seu tópico.

Sim, é possível aplicar diferentes transformações em diferentes variáveis de um conjunto de dados para construir um modelo de regressão linear. Na verdade, é uma prática comum em análise de dados e modelagem de previsão.

Como você mencionou, se a distribuição da variável target é assimétrica à direita, a transformação logarítmica pode ser uma boa opção para tentar normalizar a distribuição. Isso pode ajudar a melhorar a qualidade do seu modelo.

Quanto às variáveis categóricas, transformá-las em variáveis dummy (ou variáveis indicadoras) é uma prática padrão. Isso porque os modelos de regressão linear requerem entradas numéricas, e a transformação em variáveis dummy permite que você inclua informações categóricas no seu modelo.

Lembre-se de que, embora essas transformações possam melhorar o desempenho do seu modelo, elas também podem tornar a interpretação dos resultados um pouco mais complexa. Por exemplo, na regressão linear, os coeficientes representam a mudança na variável dependente para uma mudança de uma unidade na variável independente.

Mas se você aplicou uma transformação logarítmica à variável dependente, a interpretação desse coeficiente se torna um pouco mais complicada. De forma geral, essas aplicações conjuntas, se mostram como um bom caminho, porém tem que ser percorrido com cuidado e atenção.

Espero ter ajudado e caso tenha mais dúvidas acerca deste tópico, estarei à disposição.

Grande abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.