1
resposta

Nesta fase do projeto, devo utilizar dados normalizados?

Olá! Notei que a partir da interpretação dos clusters por gráficos os dados não estão na forma normalizada. Em meu projeto, continuei com os dados normalizados, o que mudou os resultados.

Gostaria de saber se devo ou não retornar aos dados não normalizados.

Obrigado :)

1 resposta

Olá Danilo, tudo bem? Espero que sim!

Nessa parte da análise é interessante utilizar os dados originais.

A normalização dos dados é utilizada para que atributos não tenham uma influência maior que os demais e estejam na mesma escala no momento de realizar os cálculos. Porém, ao fim do processo e com os grupos formados, iremos verificar qual a diferença entre os grupos checando a média das variáveis originais, que são os dados que conseguimos tirar alguma conclusão e ajudam na tomada de decisão.

Caso faça a análise com dados normalizados, não conseguirá interpretar a média daquela variável, porque ela não estará em uma medida a qual estamos acostumados. Por exemplo: A variável BALANCE corresponde ao saldo em reais. Caso você normalize a variável, obterá valores muito baixos e não saberá o verdadeiro saldo em reais do cliente, portanto ao obter a média do grupo, pegue a variável original BALANCE para saber o saldo médio em reais daquele grupo.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!