2
respostas

Eliminar dados com alta correlação

O exemplo da eliminação de dados com alta correlação usada não me parece ser a melhor para ensino.

E se um dos exames fosse um resultado benigno e o outro maligno? Não deveria ter considerado a classificação?

2 respostas

Fala Bruno, tudo bem?

Você diz para fazer a análise de correlação separados, benigno e maligno?

Acho que seria mais interessante a análise separadamente, mas havendo motivo de exclusão por causa de um ou outro a exclusão seria do exame como um todo.

Um exemplo do que quero explicar, exame 1 e exame 2 com correlação alta:


exame_1 = [30, 45, 60, 75, 90]

exame_1_b = [20, 30, 40, 50, 60]

exame_1_m = [10, 15, 20, 25, 30]

exame_2 = [30, 45, 60, 75, 90]

exame_2_b = [05, 20, 50, 20, 05]

exame_2_m = [25, 25, 10, 55, 85]

Se olharmos apenas para o total, há correlação, entretanto a correlação dos benignos e malignos são distintos.

Qual a sua opinião?