A estimativa do valor do imóvel foi realizada através de um modelo de Regressão Linear Múltipla, utilizando a biblioteca statsmodels em Python. O processo seguiu três etapas fundamentais:Estruturação dos Dados: Primeiramente, as características do imóvel foram organizadas em um objeto DataFrame. Foi necessária a inclusão de uma constante unitária (const), essencial para que o modelo considere o intercepto calculado durante o treinamento. As variáveis categóricas, como a qualidade da cozinha, foram tratadas como variáveis binárias (dummies).Aplicação do Modelo Simples (Modelo 0): Realizou-se uma previsão preliminar baseada exclusivamente na área do primeiro andar ($98 m^2$). Este modelo fornece uma base comparativa, focando apenas na dimensão física do imóvel.Aplicação do Modelo Multivariado (Modelo 3): Por fim, utilizou-se o modelo que integra todas as variáveis disponíveis. Esta abordagem é superior, pois isola o efeito de cada característica (como o impacto positivo de uma cozinha excelente e a ausência de um segundo andar) sobre o preço final, resultando em uma previsão mais robusta e aderente à realidade do mercado.
import pandas as pd
1. Criação do DataFrame com as características do novo imóvel
Note que 'existe_segundo_andar' é 0 (False) e 'qualidade_da_cozinha_Excelente' é 1 (True)
novo_imovel = pd.DataFrame({
'const': [1],
'area_primeiro_andar': [98],
'existe_segundo_andar': [0],
'quantidade_banheiros': [1],
'qualidade_da_cozinha_Excelente': [1]
})
2. Previsão utilizando apenas a área (Modelo 0)
Este modelo geralmente considera apenas uma variável independente
previsao_modelo_0 = modelo_0.predict(novo_imovel['area_primeiro_andar'])
3. Previsão utilizando todas as características disponíveis (Modelo 3)
O índice [0] é usado para extrair o valor escalar do resultado
previsao_modelo_3 = modelo_3.predict(novo_imovel)[0]
Exibição dos resultados
print(f"Previsão (Modelo 0 - Apenas Área): R$ {previsao_modelo_0[0]:,.2f}")
print(f"Previsão (Modelo 3 - Completo): R$ {previsao_modelo_3:,.2f}")