[Dúvida] Número de exemplos do dataframe não está coerente com o número de exemplos que roda no fit

Olá, Embora o número de exemplos para rodar o fit seja de 60000, ele treina com apenas 1875 e depois com 20% para validação e 80% para treino (48000), ele roda com apenas 1500. Os valores da perda e da acurácia estão completamente diferentes do exemplificado em aula..

modelo =keras.Sequential([
    keras.layers.Flatten(input_shape=(28,28)), #entrada
    keras.layers.Dense(256, activation = tensorflow.nn.relu),
    keras.layers.Dense(10,activation=tensorflow.nn.softmax)
    ])
modelo.compile(optimizer='adam', loss = 'sparse_categorical_crossentropy', metrics =['accuracy'])
historico = modelo.fit(imagens_treino, identificacoes_treino, epochs = 5)

Epoch 1/5
1875/1875 [==============================] - 11s 6ms/step - loss: 0.9763 - accuracy: 0.6935
Epoch 2/5
1875/1875 [==============================] - 10s 5ms/step - loss: 0.5919 - accuracy: 0.7866
Epoch 3/5
1875/1875 [==============================] - 9s 5ms/step - loss: 0.5249 - accuracy: 0.8133
Epoch 4/5
1875/1875 [==============================] - 10s 6ms/step - loss: 0.4887 - accuracy: 0.8278
Epoch 5/5
1875/1875 [==============================] - 11s 6ms/step - loss: 0.4645 - accuracy: 0.8365

________________________________________________________________________________________________________________
Epoch 1/5
1500/1500 [==============================] - 10s 6ms/step - loss: 1.0631 - accuracy: 0.6643 - val_loss: 0.6856 - val_accuracy: 0.7572
Epoch 2/5
1500/1500 [==============================] - 9s 6ms/step - loss: 0.6285 - accuracy: 0.7721 - val_loss: 0.5784 - val_accuracy: 0.7892
Epoch 3/5
1500/1500 [==============================] - 7s 5ms/step - loss: 0.5546 - accuracy: 0.8022 - val_loss: 0.5289 - val_accuracy: 0.8085
Epoch 4/5
1500/1500 [==============================] - 9s 6ms/step - loss: 0.5125 - accuracy: 0.8175 - val_loss: 0.5022 - val_accuracy: 0.8219
Epoch 5/5
1500/1500 [==============================] - 10s 7ms/step - loss: 0.4859 - accuracy: 0.8298 - val_loss: 0.4805 - val_accuracy: 0.8257

Olá Marla,

Entendo sua dúvida e vou tentar esclarecer o que está acontecendo com seu modelo.

O que está acontecendo é que o Keras divide o conjunto de treinamento em "batches", ou lotes, e o número que você vê (1875 e 1500) é o número desses lotes, não o número total de samples.

Por padrão, o tamanho do lote é 32. Então, se você tem 60.000 exemplos de treinamento, o modelo não os processa todos de uma vez, mas sim em pequenos lotes de 32 samples. Se você dividir 60.000 por 32, obterá 1875, que é o número que você vê durante o treinamento. Da mesma forma, 48000 dividido por 32 é igual a 1500.

A diferença nos resultados entre os dois estágios de treinamento é devido ao fato de que o modelo está aprendendo com um subconjunto diferente dos dados de treinamento em cada estágio. Isso pode levar a diferenças nos valores de perda e acurácia.

Quanto aos valores de perda e acurácia, eles podem variar dependendo de vários fatores, como a inicialização dos pesos do modelo, a ordem em que os exemplos são apresentados ao modelo, entre outros. Portanto, é normal que eles não sejam exatamente iguais aos valores apresentados em aula.

Espero ter ajudado e bons estudos!

Importante

[Dúvida] Número de exemplos do dataframe não está coerente com o número de exemplos que roda no fit

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP