Olá, Ewerton! Tudo bem com você?
Peço desculpa pela demora em responder o seu tópico.
Sim, é possível aplicar diferentes transformações em diferentes variáveis de um conjunto de dados para construir um modelo de regressão linear. Na verdade, é uma prática comum em análise de dados e modelagem de previsão.
Como você mencionou, se a distribuição da variável target
é assimétrica à direita, a transformação logarítmica pode ser uma boa opção para tentar normalizar a distribuição. Isso pode ajudar a melhorar a qualidade do seu modelo.
Quanto às variáveis categóricas, transformá-las em variáveis dummy (ou variáveis indicadoras) é uma prática padrão. Isso porque os modelos de regressão linear requerem entradas numéricas, e a transformação em variáveis dummy permite que você inclua informações categóricas no seu modelo.
Lembre-se de que, embora essas transformações possam melhorar o desempenho do seu modelo, elas também podem tornar a interpretação dos resultados um pouco mais complexa. Por exemplo, na regressão linear, os coeficientes representam a mudança na variável dependente para uma mudança de uma unidade na variável independente.
Mas se você aplicou uma transformação logarítmica à variável dependente, a interpretação desse coeficiente se torna um pouco mais complicada. De forma geral, essas aplicações conjuntas, se mostram como um bom caminho, porém tem que ser percorrido com cuidado e atenção.
Espero ter ajudado e caso tenha mais dúvidas acerca deste tópico, estarei à disposição.
Grande abraço e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.