O exemplo da eliminação de dados com alta correlação usada não me parece ser a melhor para ensino.
E se um dos exames fosse um resultado benigno e o outro maligno? Não deveria ter considerado a classificação?
O exemplo da eliminação de dados com alta correlação usada não me parece ser a melhor para ensino.
E se um dos exames fosse um resultado benigno e o outro maligno? Não deveria ter considerado a classificação?
Fala Bruno, tudo bem?
Você diz para fazer a análise de correlação separados, benigno e maligno?
Acho que seria mais interessante a análise separadamente, mas havendo motivo de exclusão por causa de um ou outro a exclusão seria do exame como um todo.
Um exemplo do que quero explicar, exame 1 e exame 2 com correlação alta:
exame_1 = [30, 45, 60, 75, 90]
exame_1_b = [20, 30, 40, 50, 60]
exame_1_m = [10, 15, 20, 25, 30]
exame_2 = [30, 45, 60, 75, 90]
exame_2_b = [05, 20, 50, 20, 05]
exame_2_m = [25, 25, 10, 55, 85]
Se olharmos apenas para o total, há correlação, entretanto a correlação dos benignos e malignos são distintos.
Qual a sua opinião?