1
resposta

árvore não aceita normalizacao?

No vídeo comparando os modelos, nós normalizamos o KNN para que ele pudesse fazer melhor as contas, mas eu quis testar o knn sem a normalização pra ver como ficava e realmente piorou o modelo. Tentei usar o x_train_normalizado para a árvore de decisões, pois estavamos usando o x_train sem normalizacao, mas em vez de manter ou melhorar meu modelo ele piorou a árvore. Por que isso acontece? a normalização não pode simplesmente ser aplicada em todos os modelos? árvore sem normalização de escala

árvore com normalizacao de escala

1 resposta

Olá, Alex, tudo bem?

A normalização dos dados é uma técnica que pode ser muito útil em modelos de aprendizado de máquina que são sensíveis à escala dos dados, como o KNN (K-Nearest Neighbors). Isso ocorre porque o KNN calcula a distância entre os pontos de dados para fazer suas classificações ou previsões, e se os dados estiverem em escalas muito diferentes, as variáveis com valores maiores podem dominar o cálculo da distância, levando a resultados enviesados.

A árvore de decisão, por outro lado, não é tão sensível à escala dos dados. A natureza do algoritmo permite que ele escolha automaticamente as melhores divisões com base nos valores das características. Portanto, normalizar os dados pode não ter um impacto significativo ou pode até mesmo prejudicar o desempenho da árvore de decisão.

Portanto, a normalização não é uma abordagem única para todos os algoritmos. Alguns modelos se beneficiam dela, enquanto outros não são afetados ou podem até ser prejudicados. O importante é entender as características de cada algoritmo e adaptar a pré-processamento dos dados de acordo com suas necessidades.

Espero ter esclarecido à dúvida.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software