usei a função StandardScaler(), para construir o modelo KMEANS, e fiz deploy no aws sagemaker porem ao usar o endpoint quando eu mando dados nao padronizados(normais) ele preve errado
essa foi a transfomação
from sklearn.preprocessing import StandardScaler
import numpy as np
base_salario = np.array([[20,1000],[27,1200],[21,2900],[37,1850],[46,900],
[53,950],[55,2000],[47,2100],[52,3000],[32,5900],
[39,4100],[41,5100],[39,7000],[48,5000],[48,6500]])
scaler_salario = StandardScaler() # preciso padronizar para fazer com que nao tenha problemas ao decidir valores mais importantes
base_salario = scaler_salario.fit_transform(base_salario)
base_salario = base_salario.astype('float32')
base_salario
deploy e previsao, esta dando valor errado
km_p = km.deploy(initial_instance_count=1,instance_type='ml.c4.xlarge')
test = np.array([[10 ,2000]])
rr = km_p.predict(test.astype('float32'))
[r.label['closest_cluster'].float32_tensor.values[0] for r in rr]