Rodei o modelo com 1000 epochs para saber se a quantidade de treino iria melhorar significativamente a previsão.
Segue o resultado:
layers: 1 com 256 relu
Normalizado: imagens_treino = imagens_treino/255 e imagens_teste = imagens_teste/255
Dropout = 0.2
epochs = 1000
validation_split = 0.15
metrics=['accuracy']
Tempo de execução: 3752.3424608
tempo médio: 3.75s
Perda do teste: 1.992770595769769
Acurácia do teste: 0.8905