Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Na regressão linear simples, eu poderia escrever a equação da reta dessa outra forma?

Num curso aqui da Alura "Data Science: modelos de regressão por baixo dos panos", vi que o professor ensinou a formula da reta de uma regressão linear, usada para estimar valores de Y. Porém tenho uma duvida sobre ela.

Aqui esta a print dessa formula:

Print da equação da reta mostrada no curso

O professor explicou os parametros que aparecem nessa formula:

  • Inclinação = é o primeiro parametro: esse parametro é imporante pra dizer se nossa reta está subindo, ou descendo, se ela esta mais pra baixo, etc.. como é o comportamento dela.

  • Theta0 = Segundo parametro: nos diz onde que a nossa reta corta o eixo Y(no caso o valor)

  • Erro = Ultimo parametro, o erro, ele simplismente vai dar a distancia entre o valor que eu quero, e o valor estimado que estou classificando com minha reta

Ai surgem duvida. Tenho umas 4 perguntas que gostaria de fazer sobre a formula da reta da regressão linear simples.

Duvidas:

  • 1 - Onde esta o parametro da Inclinação na fórmula? A Inclinação é o x_i * theta1 nessa formula? não consegui identificar muito bem em qual parte da formula é a Inclinação.

  • 2 - A ordem dos paremetros importa?, Melhor dizendo: o theta0 poderia ser o primeiro parametro na formula, e depois o theta1 multiplicado pelo X_i? Eu fico com essa duvida por que eu vi que o theta0 e o Erro nessa formula estão no final da formula, e eu vi na internet uma formula da reta que a ordem dos parametros era diferente. Por isso fiquei com mais essa duvida: A ordem dos paremetros poderia ser diferente? Ou seja, o theta0 poderia ser o primeiro parametro, e o theta1 multiplicado pelo X_i o segundo parametro? Como nessa imagem que eu editei ? Aqui está a imagem que eu editei pra ilustrar a pergunta:

  • Formula que editei pra perguntar se isso seria valido

  • Ou a ordem dos parametros poderia afetar o resultado?

  • 3 - Por que somamos o erro no final da formula? por acaso essa soma do erro serve para melhorar a estimativa de alguma forma ? ela tem algum papel na formula da reta?

  • 4 - E se ao invez eu de somar o erro eu subtraisse o erro ? isso tambem seria valido? eu poderia pegar a estimativa Y e subtrair o erro ao invez de somar?

2 respostas
solução!

Oii, William! Como vai?

Vou te ajudar a entender melhor, vamos lá!

Sobre a Inclinação na fórmula, o parâmetro da inclinação (01) na fórmula da reta está presente na parte 01xi. Essa parte representa a inclinação da reta, ou seja, como y.

A Ordem dos parâmetros, na matemática, a ordem da adição não afeta o resultado devido à propriedade comutativa da adição e podem variar. O que temos que considerar é a forma em como os coeficientes são estimados e interpretados. Para facilitar a interpretação, normalmente se mantém o 0 no início da equação.

A soma do erro no final da fórmula, representa o erro ou resíduo da previsão, que é a diferença entre o valor observado e o valor predito pela equação da reta. Esse termo é crucial para entender o quão bem a linha de regressão se ajusta aos dados. Ele não é somado para melhorar a estimativa, mas sim para representar a variação que o modelo não consegue explicar.

Quanto a subtrair ao invés de somar o erro, na prática, pode ser positivo ou negativo, vai depender se o valor predito é menor ou maior que o valor observado. Quando modelamos, consideramos o erro uma adição porque estamos interessados na distância do erro e não na sua direção. Subtrair o erro mudaria a interpretação do termo, mas matematicamente, o erro pode ser visto como subtraído.

Espero que essas explicações tenham esclarecido suas dúvidas. Continue se dedicando e conforme for estudando vai ficando mais fluido o entendimento.

Bons estudos, William!

Obrigado Nathalia por esclarecer esses detalhes.