1
resposta

[Dúvida] Duvida na hora de selecionar as colunas

No momento em que criamos a lista colunas binárias, estamos selecionando colunas que tem 3 valores, sendo eles 'Sim, Não e semserviçotelefônico'. o when(f.col(c)=='Sim', 1).otherwise(0) Coloca o número 0 para todos valores diferentes de 'Sim', isso não prejudica a análise, por considerar pessoas que não tem o serviço telefônico e pessoas que não tem mais de uma linha telefônica, façam parte do mesmo grupo?

1 resposta

Oi Gabriel,

Esse tipo de situação vai depender dos seus objetivos durante a análise. No caso do curso o interesse era saber apenas se o usuário possuía ou não o atributo, mas isso não impede de você como pesquisador teste essa hipótese e crie variáveis dummy com três categorias para este caso e avalie se seus resultados sofrem alguma influência.

Espero ter ajudado e bons estudos