1
resposta

Normalização de Variáveis

Olá time estou com uma dúvida a respeita das variáveis não númericas, para normaliza-las eu sempre devo considerar um limite entre elas independente do número de variáveis únicas? Como exemplo imagino que tenha quatro categorias não númericas e queira análisalás nesse caso para normalizar essas categorias basta eu definir um interva-lo (0 a 4) e categorizar essas variaveis pelos números?

Exemplo: A -> 0 B -> 2 C -> 3 D -> 4

Assim estaria normalizando certo essas variáveis?

1 resposta

Oi, tudo bem?

Desculpe a demora em te responder.

Neste cenário, é recomendado utilizar a ideia de variável dummy, uma ferramenta estatística utilizada para representar variáveis categóricas com duas ou mais categorias, assim como o seu exemplo.

O objetivo principal é converter categorias de uma variável em múltiplas colunas de indicadores, onde cada coluna representa uma categoria específica e contém apenas valores binários (0 ou 1).

Caso queira se aprofundar neste assunto, recomendo a leitura do material abaixo:

Nesse artigo, o instrutor João explora alguns métodos que podemos utilizar para trabalhar com variáveis dummy!

Espero ter ajudado! Caso surjam novas dúvidas, fico à disposição.

Abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!