Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Na regressão linear simples usando Gradiente Descedente, nessa formula para calcular o erro por que isso foi chamado de derivada?

Formula usada

Nessa formula para calcular o erro por que isso foi chamado de derivada?

Na aula do curso, quando o professor foi explicar a formula para calcular o erro do Gradiente Descedente para depois atualizar os coeficientes da regressão linear, ele disse que pra aplicar a formula do Gradiente Descedente, precisamos primeiro calcular a derivada do coeficiente theta0 e do coeficiente theta1, que era uma soma dos erros(a função MSE derivada). Mais eu estranhei ele chamar isso de derivada. Eu achava que o nome disso era delta. Uma vez perguntei na internet num forum do stackexchange e me falaram que delta e erro são a mesma coisa, mais eu nunca ouvi isso ser chamado de derivada.

Fico na duvida por que na internet, a definição de derivada geralmente é uma taxa de variação instantanea. Mais não consegui entender muito bem o por que os valores de & calculados nessa formula foram chamado de derivada.

Duvidas:

1 - Derivada e delta são a mesma coisa?

2 - Nessa fórmula, existe uma taxa de variação instantanea de algo? se sim, do que? que relação isso tem com derivada?

3 - Por que o & dos coeficientes foi chamado de derivada?

2 respostas
solução!

Oii, William! Tudo bem?

Foi chamado de deriva porque está sendo calculado a taxa de variação do erro com relação aos parâmetros do modelo, com o objetivo de reduzir o erro para melhorar o desempenho dele.

  • E não, deriva e delta não são a mesma coisa. A derivada é uma medida matemática que descreve como uma função muda à medida que seus inputs mudandam, ou seja, informa como função está mudando em um ponto específico. E o delta refere-se a mudança ou diferença nos coeficientes (theta0 e theta1).

  • Sim, existe uma taxa de variação instantânea. As fórmulas que você mostrou são derivadas parciais da função de erro quadrático médio (EQM) em relação aos coeficientes. A derivada parcial mostra como o EQM muda à medida que theta0 é ajustado, mantendo theta01 constante. Essas taxas de variação são usadas para ajustar os coeficientes de maneira a minimizar o EQM.

  • Em gradiente descendente, o que é calculado são as derivadas parciais da função de custo (neste caso, o EQM) em relação aos parâmetros do modelo dos coeficientes. Essas derivadas são usadas para entender em qual direção os valores de theta0 e theta01 devem ser ajustados para alcançar a minimização do erro. A notação delta aqui é usada para indicar uma derivada parcial, e não um "delta" no sentido de simples diferença.

Espero ter esclarecido suas dúvidas, William!

Abraço!

Obrigado por explicar sobre isso Natalia