2
respostas

Treinou o RFE com um dado e transformou com outro.

No vídeo, o professor aproveita o selecionador_rfe de uma célula do jupyter notebook e utiliza apenas para transformar os dados de valores_examesv6. Eu fiz como no código abaixo:

SEED = 1234
random.seed(SEED)

classificador = RandomForestClassifier(n_estimators=100)

selecionador_rfe = RFE(estimator=classificador, n_features_to_select=2, step=1)
selecionador_rfe.fit(valores_exames, diagnostico)
valores_exames_v7 = selecionador_rfe.transform(valores_exames)

Obs.: minha variável valores_exames é um dataframe com todos os exames, sem retirar nenhuma das features com os modelos de feature selection utlizados.

O gráfico obtido foi diferente do apresentado na aula.

2 respostas

Olá Diego!

Você não fez nenhum pré processamento antes? É isso?

Neste caso é para dar diferente mesmo, não fiz o teste mas eu esperario algo diferente mas com uma tendência semelhante! Está asim?

Olá Thiago!

Um dos gráficos ficou semelhante, mas o outro ficou espelhado em relação à uma vertical. É recomendado aplicar um modelo de feature selection, como o kbest ou RFE, no dataframe original, ou seja, sem eliminar previamente algumas features no processo de análise exploratória dos dados?

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software