Qual o motivo de excluir essas features já que estão passando de 1?
Qual o motivo de excluir essas features já que estão passando de 1?
Olá, William! Tudo bem?
A exclusão de features correlacionadas é uma prática para evitar redundância e melhorar a eficiência do modelo. Quando duas ou mais features estão altamente correlacionadas, elas carregam informações muito semelhantes. Isso pode inflar a importância dessas features no modelo, causando problemas como multicolinearidade.
Neste caso, as features estão passando de 1 na soma porque a matriz de correlação está considerando pares de features que têm uma correlação quase perfeita (acima de 0.99). Quando você soma essas correlações, o valor resultante é maior que 1, indicando que essas features estão fortemente correlacionadas.
Ao remover uma das features de cada par altamente correlacionado, você está simplificando o modelo sem perder muita informação, isso ajuda a melhorar a generalização do modelo e evitar overfitting.
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!