Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Dúvida normalização dos dados

Boa tarde, tenho duas dúvidas sobre normalização de dados:

1) É necessário normalizar a variável de resposta y quando utilizar o algoritimo knn? 2) Normalizar todos os dados " x" de entrada pode gerar algum problema? Em um conjunto de dados que existem diferentes escalas, eu preciso escolher quais variáveis devem ser normalizadas , ou posso normalizar todas , sem problemas?

Obrigado!

1 resposta
solução!

Olá, Jardel! Tudo bem com você?

Respondendo as dúvidas levantadas por você:

1) É necessário normalizar a variável de resposta “y” quando utilizar o algoritimo knn?

Não. Quando você está utilizando o KNN para resolver problema de classificação, as classes que estarão sendo trabalhadas são categóricas, como por exemplo "sim" e "não", "cachorro" e "gato", 0 ou 1, ou alguma outra categoria e não deve-se padronizar dados categóricos.

2) Normalizar todos os dados " x" de entrada pode gerar algum problema? Em um conjunto de dados que existem diferentes escalas, eu preciso escolher quais variáveis devem ser normalizadas , ou posso normalizar todas , sem problemas?

Não tem problema em normalizar todo o conjunto de dados “X”. Mas um detalhe que deve ser observado ao fazer a normalização é se no seu conjunto de dados "X" há colunas com dados categóricos, caso tenha você deve deixar essas colunas de fora da normalização. Caso o seu conjunto de dados "X" contenha esteja representado apenas dados numéricos, não há problema em realizar a normalização no conjunto inteiro.

Qualquer dúvida estou à disposição.

Bons estudos.