Oii Gabriel! Tudo bem com você? Espero que sim!
Primeiro queria te pedir desculpas pela demora em te trazer uma resposta.
O peso inicial serve como um ponto de partida para que o modelo de deep learning utilize o algoritmo de otimização, conhecido por gradiente decrescente, esse algoritmo é responsável por alterar os pesos da rede com o objetivo de minimizar as perdas (que são definidas pela função loss), o que torna o aprendizado melhor.
Mesmo com esses ajustes durante o aprendizado, alguns valores de inicialização podem atrapalhar o aprendizado, fazendo o algoritmo divergir muito nas predições, por isso, sempre é bom fazer muitos testes para verificar o melhor peso inicial.
Se quiser saber mais sobre a inicialização de peso, recomendo bastante o artigo Weight Initialization for Deep Learning Neural Networks, em português, "Inicialização de Peso para Redes Neurais de Aprendizado Profundo". OBS: Infelizmente o artigo está em inglês, então, caso tenha dificuldade em relação a este idioma, indico que tente utilizar o tradutor do navegador, para conseguir efetuar a leitura em português, mas qualquer dúvida ou dificuldade estarei à disposição
Eu espero ter te ajudado! Se surgir outra dúvida estarei disposta a ajudar ;-)
Bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!