Num curso aqui da Alura "Data Science: modelos de regressão por baixo dos panos", vi que o professor ensinou a formula da reta de uma regressão linear, usada para estimar valores de Y. Porém tenho uma duvida sobre ela.
Aqui esta a print dessa formula:
O professor explicou os parametros que aparecem nessa formula:
Inclinação = é o primeiro parametro: esse parametro é imporante pra dizer se nossa reta está subindo, ou descendo, se ela esta mais pra baixo, etc.. como é o comportamento dela.
Theta0 = Segundo parametro: nos diz onde que a nossa reta corta o eixo Y(no caso o valor)
Erro = Ultimo parametro, o erro, ele simplismente vai dar a distancia entre o valor que eu quero, e o valor estimado que estou classificando com minha reta
Ai surgem duvida. Tenho umas 4 perguntas que gostaria de fazer sobre a formula da reta da regressão linear simples.
Duvidas:
1 - Onde esta o parametro da Inclinação na fórmula? A Inclinação é o x_i * theta1 nessa formula? não consegui identificar muito bem em qual parte da formula é a Inclinação.
2 - A ordem dos paremetros importa?, Melhor dizendo: o theta0 poderia ser o primeiro parametro na formula, e depois o theta1 multiplicado pelo X_i? Eu fico com essa duvida por que eu vi que o theta0 e o Erro nessa formula estão no final da formula, e eu vi na internet uma formula da reta que a ordem dos parametros era diferente. Por isso fiquei com mais essa duvida: A ordem dos paremetros poderia ser diferente? Ou seja, o theta0 poderia ser o primeiro parametro, e o theta1 multiplicado pelo X_i o segundo parametro? Como nessa imagem que eu editei ? Aqui está a imagem que eu editei pra ilustrar a pergunta:
Ou a ordem dos parametros poderia afetar o resultado?
3 - Por que somamos o erro no final da formula? por acaso essa soma do erro serve para melhorar a estimativa de alguma forma ? ela tem algum papel na formula da reta?
4 - E se ao invez eu de somar o erro eu subtraisse o erro ? isso tambem seria valido? eu poderia pegar a estimativa Y e subtrair o erro ao invez de somar?