Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

0
respostas

[Projeto] Sessão 4 - DataLoader e Fluxo de Treinamento

Ao alterar o batch_size para 100, 20 e 5, observei que o tamanho do lote impacta diretamente o tempo de cada época e o comportamento da convergência. Com batch_size = 100, cada época foi mais rápida, levando em média 7.68 segundos, mas a loss ficou abaixo de 1.6 apenas na época 2. Com batch_size = 20, o tempo médio por época foi de 14.45 segundos e a loss ficou abaixo de 1.6 já na época 1. Com batch_size = 5, a loss também ficou abaixo de 1.6 na época 1 e chegou ao menor valor final, 1.4870, porém o tempo por época aumentou bastante, chegando a 44.63 segundos. Assim, percebi que batches menores podem favorecer atualizações mais frequentes e reduzir a loss, mas aumentam o custo computacional. Neste experimento, o batch_size = 20 pareceu oferecer o melhor equilíbrio entre tempo de treinamento e convergência.

Batch sizeTempo médio por épocaÉpoca em que a loss ficou abaixo de 1.6Loss final
1007.68sépoca 21.5086
2014.45sépoca 11.4910
544.63sépoca 11.4870

Segue o link do código:https://github.com/Moquiuti/Rede-Neural-Deep-Learning-com-PyTorch/blob/main/Carregamento_de_Dados.ipynb