1
resposta

Como usar um modelo que usei o StandardScaler, em producao

usei a função StandardScaler(), para construir o modelo KMEANS, e fiz deploy no aws sagemaker porem ao usar o endpoint quando eu mando dados nao padronizados(normais) ele preve errado

essa foi a transfomação

from sklearn.preprocessing import StandardScaler
import numpy as np
base_salario = np.array([[20,1000],[27,1200],[21,2900],[37,1850],[46,900],
                        [53,950],[55,2000],[47,2100],[52,3000],[32,5900],
                        [39,4100],[41,5100],[39,7000],[48,5000],[48,6500]])

scaler_salario = StandardScaler() # preciso padronizar para fazer com que nao tenha problemas ao decidir valores mais importantes
base_salario = scaler_salario.fit_transform(base_salario)
base_salario = base_salario.astype('float32')
base_salario

deploy e previsao, esta dando valor errado

km_p = km.deploy(initial_instance_count=1,instance_type='ml.c4.xlarge')
test = np.array([[10 ,2000]])
rr = km_p.predict(test.astype('float32'))
[r.label['closest_cluster'].float32_tensor.values[0] for r in rr]
1 resposta

Olá Augusto, tudo bem? Espero que sim!

O Standard scaler também pode ser armazenado em um arquivo assim como um modelo de machine learning, para ser utilizado posteriormente com o método transform em dados novos antes de serem passados para o método predict do modelo.

Bons estudos!