Referente ao curso Treinando uma Rede Neural: Deep Learning com PyTorch, no capítulo Funções de Perda e atividade Regressão
Por que foi utilizada a dim = -1 na função softmax()?
Continue sua jornada tech com ainda mais tempo para aprender e evoluir
A dimensão do dado que flui na rede é B X N (tamanho do batch x tamanho da feature). O índice -1 se refere à última dimensão, ou seja, a dimensão da feature.