0
respostas

Utilizar X_treino para obter a mediana

Olá.

Quando se obtém a mediana de X_treino está utilizando, nesse caso, todas as 38 classes (features) nessa conta?

Sendo assim, se houver muitas classes com valores binários, a mediana irá tender para valores entre 0 e 1. Por outro lado, se houver muitas classes com valores bem altos, como 2000, 3000, 4000, por exemplo, a mediana poderia tender a valores distantes de 0 e 1.

É certo que esse pode não ser o problema, já que em aulas anteriores foi feita a normalização dos dados. Todavia, o algoritmo, que roda por trás dos panos, consegue identificar as features binárias e as não binárias, no momento da normalização, de modo a realizar uma padronização mais adequada?

Espero ter sido claro. Obrigado!