1
resposta

inverse_transform()

Qual a diferença entre usar o scaler.inverse_transform(dados_escalados) e fazer as analises em cima do dado original sem normalizar (dados)?

Não entendi porque reverter a escala pra obter o dado original se nós já temos acesso ao dado original

1 resposta

Oi Marianna, tudo bem?

Durante o treino, o K-means trabalha apenas com os dados normalizados (dados_escalados), porque a normalização garante que todas as variáveis tenham o mesmo peso no cálculo das distâncias.

Quando usamos scaler.inverse_transform(dados_escalados), estamos revertendo essa normalização, ou seja, trazendo esses mesmos dados de volta para a escala original. Os valores passam a representar novamente as unidades reais do conjunto de dados, o que facilita a interpretação.

Isso não é o mesmo que usar diretamente o dados original, porque:

  • os clusters foram definidos a partir dos dados normalizados;
  • o inverse_transform garante que estamos analisando exatamente os mesmos pontos que o modelo utilizou, apenas em outra escala.

Então, normalizamos os dados para o modelo aprender corretamente e revertemos a normalização para entender melhor os resultados em valores reais.

Espero ter ajudado.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!