1
resposta

Mão na massa: análise e seleção de modelos de regressão linear

import seaborn as sns
import matplotlib.pyplot as plt

sns.pairplot(df)
plt.show()
import statsmodels.api as sm

X = df[['Estrelas']]
y = df['Preco']

X = sm.add_constant(X)
modelo_simples = sm.OLS(y, X).fit()

print(modelo_simples.summary())
X = df[['Estrelas', 'ProximidadeTurismo', 'Capacidade']]
y = df['Preco']

X = sm.add_constant(X)
modelo_multiplo = sm.OLS(y, X).fit()

print(modelo_multiplo.summary())
X = df[['Estrelas', 'ProximidadeTurismo', 'Capacidade']]
y = df['Preco']

X = sm.add_constant(X)
modelo_multiplo = sm.OLS(y, X).fit()

print(modelo_multiplo.summary())
print("R² modelo simples:", modelo_simples.rsquared_adj)
print("R² modelo múltiplo:", modelo_multiplo.rsquared_adj)

O modelo de regressão múltipla apresentou maior poder explicativo do preço
dos quartos, evidenciado por um R² ajustado superior ao modelo simples.
As variáveis Estrelas e Capacidade mostraram-se estatisticamente significantes, indicando forte influência na precificação.

1 resposta

Ei! Tudo bem, John Lenon?

Muito bom o seu desenvolvimento na atividade, parabéns!
Você estruturou certo os modelos simples e múltiplo, comparou o R² ajustado de forma adequada e chegou a uma interpretação coerente dos resultados. A análise sobre o maior poder explicativo do modelo múltiplo e a significância das variáveis está alinhada com o que se espera nesse exercício.

Excelente trabalho, siga avançando nesse ritmo! E qualquer dúvida, compartilhe!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado