Olá, Danival! Tudo bem?
Você pode realizar essa normalização da forma como você fez, porém o resultado que será obtido depende do seu dataset e de como as características desse conjunto de dados estão distribuídas.
O resultado obtido por você usando a técnica de padronização pode ter sido melhor pois a distribuição dos dados possui um comportamento parecido com uma Gaussiana normal, e essa técnica gera melhores resultados nessa situação.
Você pode utilizar essa transformação no conjunto de dados como um todo pois todas as suas features(colunas) estavam na mesma escala, que é de 0 a 255 de acordo com a cor dos pixels, porém para conjuntos de dados que não possuem essa característica, não podemos utilizar essa técnica dessa forma, teríamos que padronizar cada feature separadamente.
Então é normal obter resultado diferentes para técnicas de normalização diferentes, dependendo de como o seu dataset está distribuído.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!