Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Sugestão] Necessidade de todas as colunas das variáveis dummies

Acredito que seria interessante discutirmos também a remoção de uma das colunas ao trabalharmos com variáveis dummies. Isso porque, ao transformar uma variável categórica com n categorias em n colunas dummies, uma delas pode ser excluída sem perda de informação, já que seu valor é implicitamente indicado quando as demais colunas têm valor zero. Por exemplo, para a variável Internet, com categorias 'DSL', 'FibraÓptica' e 'Não', se as colunas DSL e FibraÓptica forem ambas zero, automaticamente sabemos que a categoria é 'Não'. Em bases pequenas, manter todas as colunas pode não ter um impacto significativo. No entanto, em conjuntos de dados maiores, com muitas variáveis categóricas, deixar todas as dummies pode gerar dezenas de colunas extras desnecessárias, o que pode afetar a performance do modelo e dificultar a interpretação.

1 resposta
solução!

Ei, João! Tudo bem?

Obrigada por compartilhar sua sugestão com a gente. É sempre muito bom ouvir ao que vocês têm a dizer.

O que abordou é válido e reflete boas práticas em estatística e aprendizado de máquina!

Transformar uma variável categórica com n categorias em n-1 colunas dummies evita a multicolinearidade, conhecida como "armadilha das variáveis fictícias". Por exemplo, para a variável "Internet" com categorias 'DSL', 'FibraÓptica' e 'Não', remover a coluna 'Não' mantém toda a informação, já que 'Não' é implícito quando 'DSL' e 'FibraÓptica' são zero. Essa prática economiza espaço, melhora a performance do modelo e exige cuidado para manter a clareza na interpretação dos resultados.

Peço por gentileza que reforce o seu feedback no formulário de pesquisa disponível ao final do curso, dessa forma a equipe responsável também terá acesso à sua sugestão. E pode considerar melhorias futuras no conteúdo.

Continue se dedicando e qualquer dúvida, conte conosco.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!