Dúvida R² treino R² previsão

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

4
respostas

por Gabriela Villagran Pereira

| 242.5k xp | 23 posts

A situação:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Estou com dúvida quanto ao R² treino R² previsão, no problema que estou estimando, sem utilizar o random_state obtive esses valores:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Em aula, o professor utiliza o random_state, então fiquei com dúvida com essas flutuações dos valores de R², o quanto seria bom ou ruim?

4 respostas

por Ana Duarte

| 162.8k xp | 206 posts

Instrutor

19/05/2022

Olá Gabriela, tudo bem?

O R² é uma das medidas de qualidade do modelo, mas especificamente sobre a explicabilidade do seu modelo. Essa métrica pode variar entre 0 a 1, e quanto mais perto de 1 melhor.

output do modelo com a informação "R-squared: 0.717" circulada em vermelho

Nesse output que você mostrou temos 0.717 e podemos interpretar, de forma isolada, que o seu modelo explica 71,7% do fenômeno (Y) através das variáveis dependentes (X's) utilizadas.

Espero ter te ajudado a entender melhor essa métrica. :)

por Gabriela Villagran Pereira

| 242.5k xp | 23 posts

19/05/2022

Olá, boa noite

Sabe me dizer quanto ao R² treino R² previsão ? eu não usei uma seed para poder comparar esses valores, queria saber se essas flutuações entre esses valores é normal, o quanto que seria adequado pro modelo. Abaixo eu deixei um print de alguns R² que foram gerados.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

solução!

por Ana Duarte

| 162.8k xp | 206 posts

Instrutor

20/05/2022

Gabriela, É normal ter variação entre o R quadrado do teste e do treino, isso por causa da amostragem msm, já que essas métricas são calculadas com base nos seus dados.

Sobre o quanto seria adequado para o modelo, sinto dizer que não há um consenso na literatura quanto à esse número. Há quem use um conjunto de métricas além do R² para analisar a qualidade do modelo, e também tem quem utiliza a própria interpretação da métrica, ou seja, usando um dos resultados, eu lhe pergunto será que 70% é uma boa métrica para explicabilidade? 70% de 100% parece um bom parâmetro para mim, mas existem casos, por exemplo na saúde, que é preciso adicionar outras variáveis explicativas para aumentar essa métrica.

Em resumo, é normal que o R² seja diferente na amostra do treino e no teste, além disso, não há um ponto específico no R² que diz se é bom ou ruim, isso vai depender da sua análise e do que faz sentido dentro do modelo.

Sei que é um ponto mais abstrato, mas eu espero ter esclarecido um pouco mais.

por Gabriela Villagran Pereira

| 242.5k xp | 23 posts

22/05/2022

Muito obrigada, conseguiu me esclarecer !!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP