Variei alguns itens para ver como se comporta cada modelo.
O que notei foi que usando a normalização das imagens foi necessário um pouco mais de memória (5%) e processamento (3%).
A medida que for fazendo mais testes vou postando para avaliarmos o melhor ajuste.
----------------------------------------
layers: 1 = 256 relu
Normalizado: imagens_treino = imagens_treino/255 e imagens_teste = imagens_teste/255
epochs = 100
validation_split = 0.15
metrics=['accuracy']
Tempo de execução: 368.3534161 segundos
Tempo Médio: 3.69s
Perda do teste: 0.9306023919880391
Acurácia do teste: 0.8824
----------------------------------------
layers: 2 = 256 e 128 relu
Normalizado: imagens_treino = imagens_treino/255 e imagens_teste = imagens_teste/255
epochs = 100
validation_split = 0.15
metrics=['accuracy']
Tempo de execução: 391.0000407 segundos
Tempo Médio: 3.91s
Perda do teste: 1.1055604360967874
Acurácia do teste: 0.8891
----------------------------------------
layers: 1 = 256 relu
Normalizado: Não
epochs = 100
validation_split = 0.15
metrics=['accuracy']
Tempo de execução: 352.4675158 segundos
Tempo Médio: 3.53s
Perda do teste: 0.9937193917036057
Acurácia do teste: 0.8266
----------------------------------------
layers: 2 = 256 e 128 relu
Normalizado: Não
epochs = 100
validation_split = 0.15
metrics=['accuracy']
Tempo de execução: 376.72405230000004 segundos
Tempo Médio: 3.77s
Perda do teste: 0.8627762942194939
Acurácia do teste: 0.8738