Olá, Humberto! Tudo bem?
Entendo sua dúvida e é ótimo que você esteja buscando esclarecimentos. Na verdade, o que mencionei na aula foi que algoritmos lineares podem ser sensíveis à falta de normalização, especialmente quando lidamos com diferentes escalas de valores.
No entanto, para modelos baseados em árvores de decisão, como estamos utilizando, a normalização não é crucial, pois esses modelos não são tão sensíveis a variações nas escalas dos dados. Portanto, para o tipo de modelo que estamos trabalhando, não é estritamente necessário normalizar os dados.
É importante entender que os algoritmos de classificação lineares, como a regressão logística e as máquinas de vetores de suporte (SVM) linear, operam sob a premissa de separar as classes por meio de uma linha, plano ou hiperplano, usando uma combinação linear dos recursos de entrada.
Por outro lado, os algoritmos baseados em árvores de decisão, como o CART (Árvores de Classificação e Regressão) e o Random Forest, utilizam regras de decisão hierárquicas para classificação. Essas regras são derivadas dos dados e oferecem uma modelagem flexível, capaz de lidar com relações não lineares e interações complexas entre os atributos.
Continue questionando e explorando! Estou aqui para ajudar no que precisar. Bons estudos!