1
resposta

Gráfico de dispersão

Não estão claros para mim os significados dos eixos no gráfico de dispersão entre o valor estimado e o valor real? Porque espera-se uma relação linear? O grau de dispersão (espalhamento dos pontos) é um indicativo de erro no modelo? Poderia traçar o gráfico após transformar os valores com a função exponencial?

ax=sns.scatterplot(x=y_previsto_train,y=y_train)
ax.figure.set_size_inches(12, 6)
ax.set_title('Previsão X Real', fontsize=18)
ax.set_xlabel('log do Preço - Previsão', fontsize=14)
ax.set_ylabel('log do Preço - Real', fontsize=14)
ax.set_xbound(lower=0)
ax.set_ybound(lower=0)
ax
1 resposta

Boas Gabriel! Tudo bem? Espero que sim.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Os eixos no gráfico representam os valores de Y que foram previstos pelo modelo (no eixo x) e no eixo Y os valores reais dos imóveis.

Espera-se uma relação linear pois, se o modelo estivesse perfeitamente ajustado aos dados, os valores de y previsto e y real seriam os mesmos.

Como isso é impossível, o que verificamos é como os erros estão distribuídos.

Sim! o grau de dispersão é exatamente um indicativo de quanto o modelo está acertando, quanto mais ajustado à reta X=y, mais ele está ajustado, e quanto mais dispersos os dados, maior é o erro do modelo.

Os valores do gráfico poderia sim, sem problemas ser transformado de volta para valores (que não estão em log), porém, isso iria aumentar o erro visualmente.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!