Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

R² do treino

Por favor, explique melhor essa linha (# Qual o R² do treino?)... Esta sendo comparado os dados reais em y_test com o que foi previsto pelo modelo em predict_3 ?????

# Prevendo com o modelo 3
predict_3 = modelo_3.predict(x_test[['const','area_primeiro_andar','existe_segundo_andar','quantidade_banheiros','qualidade_da_cozinha_Excelente']])

# Qual o R² do treino?
print('R2: ', r2_score(y_test, predict_3))

R2:  0.6432078074497707
2 respostas
solução!

Oi Ceilton, tudo bem?

Referente ao código mencionado:

print('R2: ', r2_score(y_test, predict_3))

O código acima tem o objetivo de calcular o coeficiente de determinação, R², para o seu modelo de regressão linear. O R² é uma métrica que indica o quão bem os dados previstos pelo modelo se ajustam aos dados reais.

Portanto, sim, está, de fato, comparando os dados reais do preço de venda das casas na base de teste (y_test) com o que o modelo modelo_3 previu para essas mesmas casas (predict_3).

Isso é importante porque queremos ver como o modelo se comporta com dados que ele nunca viu antes (dados de teste), e não apenas com os dados que ele foi treinado. O objetivo é verificar se o modelo está aprendendo a relação entre as variáveis explicativas e o preço de venda das casas de forma consistente, tanto para os dados que ele já viu (treinamento) quanto para os dados que ele nunca viu antes (teste).

Espero ter ajudado.

Qualquer dúvida, compartilhe no fórum.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Obrigado Monalisa