Olá pessoal, tudo bem?
Assisti a aula e comecei a refletir bastante. Pra mim é estranho pensar que a rede da aula tinha três saídas, visto que normalmente as variáveis são colocadas no formato y = {1: Gato, 2: Cachorro, 3: Papagaio}, ou seja, com a camada de saída possuindo apenas uma variável e três possíveis valores.
Nesse caso, é como se o formato da camada de saída fosse y1, y2, e y3, em que duas são 0 e alguma outra é 1.
Me lembrei na hora das aulas da disciplina de Sistemas Digitais na faculdade, e o conceito de One Hot Encoder, e descobri que o termo também é usado no contexto de classificação em ciência de dados, aí minha cabeça explodiu. É isso mesmo que está acontecendo? Qual a vantagem de utilizar o One Hot Encoder nesse caso? Costuma funcionar melhor?
Grato!