Tuning de hiperparâmetros | Deep Learning parte 2: como a rede aprende

Olá, Rodrigo! Tudo bem com você?

Sua observação está correta. Obatch_size é o número de amostras que serão passadas para a rede neural de uma vez. Usando esse exemplo de 48.000 amostras para treinamento, se fosse deixado o batch_size padrão de 32, primeiro 32 amostras seriam passadas através da nossa rede neural com propagação e retro propagação e então os pesos seriam atualizados, e esse processo se repetiria até completar todas as amostras utilizadas para treino, sempre com 32 amostras. Ou seja, o processo seria executado 48.000/32 = 1500 vezes e aí teríamos o treinamento de uma época.

Quando aumentamos o batch_size para 480 estamos levando mais amostras cada vez que percorremos nossa rede, o que diminui o número de iterações por época, como você mencionou. Agora nossa rede faria o processo de propagação e retro propagação para atualização dos pesos 48.000/480 = 100 vezes, diminuindo o tempo necessário para a execução do código.

Espero ter ajudado e caso surja alguma dúvida estou sempre à disposição.