Qual a diferença entre usar o scaler.inverse_transform(dados_escalados) e fazer as analises em cima do dado original sem normalizar (dados)?
Não entendi porque reverter a escala pra obter o dado original se nós já temos acesso ao dado original
Qual a diferença entre usar o scaler.inverse_transform(dados_escalados) e fazer as analises em cima do dado original sem normalizar (dados)?
Não entendi porque reverter a escala pra obter o dado original se nós já temos acesso ao dado original
Oi Marianna, tudo bem?
Durante o treino, o K-means trabalha apenas com os dados normalizados (dados_escalados), porque a normalização garante que todas as variáveis tenham o mesmo peso no cálculo das distâncias.
Quando usamos scaler.inverse_transform(dados_escalados), estamos revertendo essa normalização, ou seja, trazendo esses mesmos dados de volta para a escala original. Os valores passam a representar novamente as unidades reais do conjunto de dados, o que facilita a interpretação.
Isso não é o mesmo que usar diretamente o dados original, porque:
inverse_transform garante que estamos analisando exatamente os mesmos pontos que o modelo utilizou, apenas em outra escala.Então, normalizamos os dados para o modelo aprender corretamente e revertemos a normalização para entender melhor os resultados em valores reais.
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!