A professora realizou a normalização, dividindo por 256, mas aparentemente esqueceu de remover tal linha da célula de treinamento do modelo, o que fez com que toda vez que executasse um novo treinamento realizasse novamente esta divisão. Isto fez com que o parâmetro "loss" crescesse a cada treinamento.