Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Na regressão linear, na formula do Gradiente Descedente na hora de calcular o derivada do MSE, na hora de dividir o erro acumulado, eu posso tirar a média ao invez de dividir pela metade da quantidade de amostras?

Na regressão linear, na formula do Gradiente Descedente na hora de calcular o derivada do MSE, na hora de dividir o erro acumulado, eu posso tirar a média, ao invez de dividir pela metade da quantidade de amostras?

Deixe eu explicar melhor minha duvida:

Notei que na formula usada pelo professor para calcular a derivada do coeficiente theta1 usando o EQM, ele primeiro soma todos os erros, e depois no final ele divide o resultado dessa soma por 2 dividido pela quantidade de amostras.

Marquei em vermelho na imagem essa parte da formula.

Formula que estou com duvida

No código essa divisão fica mais evidente(destaquei a parte que faz a divisão em vermelho tambem), onde ele pega o resultado da soma e divide por 0.5 multiplicado pela quantidade de amostras X, ou seja, na realidade, ele esta dividindo o resultado da soma pela metade da quantidade de amostras

Codigo em python da formula que estou com duvida

ou seja, apos obter a soma de todos os erros, ele esta dividindo o resultado dessa soma por 0.5 * QUANTIDADE DE AMOSTRAS, que na realidade 0.5 * QUANTIDADE DE AMOSTRAS matematicamente é a metade da quantidade de amostras.

Mais com isso fiquei na duvida:

DUVIDA: EU PRECISO DIVIDIR O ERRO ACUMULADO POR 0.5 * QUANTIDADE DE AMOSTRAS IGUAL ELE FEZ ? Ou eu posso dividir o ERRO ACUMULADO simplismente pela propia QUANTIDADE DE AMOSTRAS MESMO sem precisar dividir pela metade da QUANTIDADE DE AMOSTRAS ?

ex: poderia ser assim? VOU CITAR ABAIXO A FORMA QUE EU IMAGINEI EM FAZER:

Formula que imaginei

Eu fico na duvida se eu poderia fazer tambem dessa forma que imaginei

Tenho algumas duvidas:

1 - EU PRECISO DIVIDIR O ERRO ACUMULADO POR 0.5 * QUANTIDADE DE AMOSTRAS IGUAL ELE FEZ ? Ou eu posso dividir o ERRO ACUMULADO simplismente pela QUANTIDADE DE AMOSTRAS MESMO sem precisar dividir a QUANTIDADE DE AMOSTRAS pela metade?

2 - Explicando melhor minha duvida: Ou seja, eu posso pegar o erro acumulado e dividir pela propia QUANTIDADE DE AMOSTRAS ? ou seja tirar a média mesmo? ao invés de fazer dessa forma? seria valido?

3 - Poderia ter alguma desvantagem ou problema se eu dividisse pela quantidade de amostras?

2 respostas
solução!

Olá, William, tudo bem?

Uau! Que bom que você está acada vez mais se aprofundando neste conhecimento! Bom respondendo as suas dúvidas:

  1. Dividir o erro acumulado por 0.5 * quantidade de amostras: Isso é comum de se fazer porque simplifica os cálculos, mas não é a única maneira de fazer. É uma espécie de truque matemático que nos ajuda a chegar ao mesmo resultado de forma mais rápida.

  2. Dividir o erro acumulado pela quantidade de amostras (tirar a média): Isso também é válido. Significa que você está calculando o quanto cada amostra contribuiu para o erro médio, em vez do total. Pode funcionar, mas você pode precisar ajustar outras partes do seu algoritmo para compensar essa mudança.

  3. Desvantagens ou problemas: Fazer a média pode tornar o treinamento mais lento ou menos estável. É como se você estivesse ajustando o tamanho dos passos que o algoritmo dá para encontrar a resposta certa. Se você dividir por 2, é como se estivesse dando passos maiores em direção à resposta. Se você dividir pela quantidade de amostras, estará dando passos menores. Ambos podem funcionar, mas dependendo do caso um pode ser melhor que o outro.

Resumindo, é uma escolha entre fazer cálculos mais simples ou possivelmente tornar o treinamento do seu modelo um pouco mais complexo, mas não há uma resposta certa ou errada. É importante testar e ver o que funciona melhor para o seu problema específico.

Espero ter esclarecido.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Obrigado por explicar Monalisa