1
resposta

Numero de amostras de treino/teste parecem ser diferentes no input

![](Resultado do código de modelo.fit usando entrada de dados com 60000 amostras, porém aparece que está usando apenas 1500 )

Apesar deu conferir que a variável imagens_treino tem tamanho (60000,28,28), ele treina usando apenas 1500 imagens. O mesmo acontece com o teste, onde existem 10000 amostras, mas ele testa apenas com 313.

Sabe o motivo disso acontecer?

Muito obrigada

1 resposta

Olá! Tudo bem?

Entendo que possa gerar alguma confusão esses números apresentados na saída do método fit(). No seu caso, você está vendo 1500 e 313, mesmo tendo 60.000 e 10.000 amostras de treino e teste, respectivamente. Isso acontece por causa do conceito de batch size no treinamento de redes neurais.

Por padrão, o Keras utiliza um tamanho de batch de 32, como podemos notar na documentação.

Isso significa que, ao invés de alimentar todas as suas 60.000 amostras de uma vez só para a rede (o que poderia ser muito pesado computacionalmente), ele divide essas amostras em pequenos lotes (batches) de 32 amostras cada. Portanto, quando você vê o número 1500, isso significa que o Keras dividiu suas 60.000 amostras em 1500 lotes (porque 60000/32 é 1875, mas o Keras arredondou para baixo). O mesmo aconteceu com o conjunto de teste.

Para saber um pouco mais sobre as variáveis de batch_size, epochs e steps_per_epoch , recomendo a leitura desse artigo do Medium.

Forte abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software