Solucionado (ver solução)
Solucionado
(ver solução)
4
respostas

Dúvida R² treino R² previsão

A situação:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Estou com dúvida quanto ao R² treino R² previsão, no problema que estou estimando, sem utilizar o random_state obtive esses valores:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Em aula, o professor utiliza o random_state, então fiquei com dúvida com essas flutuações dos valores de R², o quanto seria bom ou ruim?

4 respostas

Olá Gabriela, tudo bem?

O R² é uma das medidas de qualidade do modelo, mas especificamente sobre a explicabilidade do seu modelo. Essa métrica pode variar entre 0 a 1, e quanto mais perto de 1 melhor.

output do modelo com a informação "R-squared: 0.717" circulada em vermelho

Nesse output que você mostrou temos 0.717 e podemos interpretar, de forma isolada, que o seu modelo explica 71,7% do fenômeno (Y) através das variáveis dependentes (X's) utilizadas.

Espero ter te ajudado a entender melhor essa métrica. :)

Olá, boa noite

Sabe me dizer quanto ao R² treino R² previsão ? eu não usei uma seed para poder comparar esses valores, queria saber se essas flutuações entre esses valores é normal, o quanto que seria adequado pro modelo. Abaixo eu deixei um print de alguns R² que foram gerados.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

solução!

Gabriela, É normal ter variação entre o R quadrado do teste e do treino, isso por causa da amostragem msm, já que essas métricas são calculadas com base nos seus dados.

Sobre o quanto seria adequado para o modelo, sinto dizer que não há um consenso na literatura quanto à esse número. Há quem use um conjunto de métricas além do R² para analisar a qualidade do modelo, e também tem quem utiliza a própria interpretação da métrica, ou seja, usando um dos resultados, eu lhe pergunto será que 70% é uma boa métrica para explicabilidade? 70% de 100% parece um bom parâmetro para mim, mas existem casos, por exemplo na saúde, que é preciso adicionar outras variáveis explicativas para aumentar essa métrica.

Em resumo, é normal que o R² seja diferente na amostra do treino e no teste, além disso, não há um ponto específico no R² que diz se é bom ou ruim, isso vai depender da sua análise e do que faz sentido dentro do modelo.

Sei que é um ponto mais abstrato, mas eu espero ter esclarecido um pouco mais.

:)

Muito obrigada, conseguiu me esclarecer !!