Olá,
- Por que separar os dados em conjuntos de treino e teste?
- Não seria mais fácil e robusto usar todo o conjunto de dados, fazer a regressão e depois comparar os valores previstos com os valores reais? Por exemplo, temos os dados reais de valor e distancias, entao fazemos previsoes dos valores para cada linha do dataset e comparamos as com os dados reais e podemos plotar isso, assim em cada linha teriamos um Valor_previsto vs Valor_real. Caso tenhamos novos dados de distancia poderemos predizer o valor do imovel com o nosso modelo com uma margem de erro.
Obrigado