Na a aula de variáveis categóricas foi proposto que a variável categórica busca fosse transposta em N colunas representando o conteúdo daquela variável. Pensando em um sistema em crescimento onde essa variável terá constantemente novos valores como conteúdo, teríamos que realizar alterações constantes para considerar esses novos valores.
Pensando nessa dinâmica, qual seria o impacto de representar uma variável com essa característica (categórica e com adição frequente de conteúdo), em um número representativo a partir de posições fixas, por exemplo ordem alfabética?
Exemplo: Pensando na busca por cursos com os termos:
- c++
- java
- python
- ruby
teríamos a seguinte representação em apenas uma coluna:
busca | representação int |
---|---|
c++ | 1000 |
java | 0100 |
python | 0010 |
ruby | 0001 |
Entendo que em uma categorias com muitos valores existiria uma limitação pelo quantidade de de números de um int, mas para escopos menores, essa abordagem é possível?