1
resposta

Softmax()

Por que foi utilizada a dim = -1 na função softmax()?

1 resposta

A dimensão do dado que flui na rede é B X N (tamanho do batch x tamanho da feature). O índice -1 se refere à última dimensão, ou seja, a dimensão da feature.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software