Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

R2 e R2 ajustado

"O R² ajustado é uma medida mais robusta do que o R² simples, pois penaliza a inclusão de variáveis que não contribuem significativamente para o modelo. Isso ajuda a equilibrar a complexidade do modelo com sua capacidade explicativa, fornecendo uma base mais sólida para a escolha do modelo."

Não entendi essa diferenciação... Onde esta o R2 simples e o R2 ajustado? Vejo apenas um R2 no :

print(modelo_3.summary())
print('Modelo 3: ', modelo_3.rsquared)

Acredito que os dois comandos tragam o mesmo R2...

2 respostas
solução!

Olá, Ceilton!

Estou aqui para ajudar você! :)

Para ajudar você a entender essa diferenciação, vou começar falando sobre o que a atividade pede e vou apresentar uma justificativa mais detalhada sobre a alternativa correta.

A atividade te coloca na pele de um cientista de dados que precisa escolher o melhor modelo para prever o preço de casas. Você tem quatro modelos, cada um com um número diferente de variáveis. O exercício te apresenta um desafio: modelos com mais variáveis tendem a ter um R² maior, mas isso não significa que sejam melhores. A pergunta é: qual critério você usaria para escolher o melhor modelo?

A alternativa correta apresenta o modelo com o R² ajustado como uma medida mais robusta do que o R² simples. Mas, qual a diferença entre R² simples e R² ajustado?

O R² simples mede a proporção da variância na variável dependente que é previsível a partir das variáveis independentes. Ele dá uma ideia de quão bem os inputs (variáveis independentes) podem explicar a variação da saída (variável dependente). Um R² de 1 indica que o modelo explica toda a variabilidade, enquanto um R² de 0 indica que o modelo não explica nada da variabilidade.

O R² ajustado, por outro lado, é uma versão modificada do R² simples que leva em conta o número de variáveis no modelo. Ele ajusta o R² com base no número de observações e a quantidade de termos no modelo, penalizando a inclusão de variáveis que não melhoram significativamente o modelo. Isso é útil em modelos com muitas variáveis, onde o R² pode parecer artificialmente alto simplesmente porque há muitas variáveis, mesmo que elas não sejam todas úteis.

Para acessar o R² ajustado no output do summary() em muitas bibliotecas estatísticas como statsmodels em Python, você encontrará uma entrada chamada "Adj. R-squared". Isso mostra o R² ajustado. Abaixo está um exemplo de como você poderia visualizar isso:

import statsmodels.api as sm

# assumindo que você já tem um modelo ajustado
summary = modelo_3.summary()
print(summary)

Olhe na tabela de saída do summary, geralmente na parte superior direita, você verá o R² ajustado listado como "Adj. R-squared". Este valor será diferente do R² simples ("R-squared") se houver múltiplas variáveis no modelo.

→ Para entender melhor, você pode pesquisar sobre o conceito de "sobreajuste" em modelos de regressão.

Espero ter ajudado!

Abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Bom dia Maiully. Esse trecho esclareceu a questão:

"O R² ajustado, por outro lado, é uma versão modificada do R² simples que leva em conta o número de variáveis no modelo. Ele ajusta o R² com base no número de observações e a quantidade de termos no modelo, penalizando a inclusão de variáveis que não melhoram significativamente o modelo."

Obrigado.