1
resposta

[Dúvida] Padronizando/Normalizando variáveis Qualitativas

Olá, eu não estou conseguindo compreender o sentido de se padronizar (no vídeo a professora fala erroneamente "normalizar") variáveis Qualitativas/Categóricas como por exemplo a variável Cônjuge (1 se for casado, 0 caso contrário), ou a variável Dependentes (1 se tiver dependentes, 0 caso contrário).

Veja que essas variáveis categóricas sempre assumirão valores que podem ser 0 ou 1, isto é, já estão numa escala perto do valor 0. Para as únicas variáveis quantitativas, que são MesesDeContrato e ContaMensal, faz sentido SIM aplicar a padronização, pois estaremos reduzindo a escala deles para média igual a 0 e desvio padrão igual a 1. Ou seja, vamos reduzir a escala de MesesDeContrato e ContaMensal para valores próximos de 0!

Esta foi a primeira dúvida (Porque padronizamos variáveis categóricas binárias).

A segunda pergunta é, qual é a nova interpretação dos valores padronizados das variáveis categóricas. Por exemplo, note que após a padronização o campo Cônjuge começou a apresentar valores quebrados, como por exemplo : 1,26

O que significa isso? Que a pessoa é casada com 1 pessoa e mais 0,26 com outra? (casado com uma pessoa e tem uma amante?kkk)

1 resposta

A título de curiosidade, normalizando apenas as variáveis quantitativas a acurácia do modelo aumenta...