Boa tarde! Estou gerando um modelo de regressão linear e caí na seguinte situação:
- Testei o modelo com os dados com standardscaler, e deu um r2 de 0.68
- Testei o modelo com os dados com transformação em log, e deu um r2 de 0.79
- Por último, sem querer (kkkk), apliquei o teste 1 novamente, mas enviei tanto os dados normais quanto transformados em base log para treinamento... e resultou em um r2 de 0.81
Minha dúvida é: é possível que minha base de dados tenha as features com transformação em log JUNTO com os dados normais? No t-test, todas as features se mostraram estatisticamente relevantes, mas não sei se isso vai contra algum conceito (nunca vi ninguém fazer isso).
Se alguém puder dar uma mão, agradeço bastante!