Olá, tudo bem? :)
Tenho uma dúvida quanto ao curso de modelos de classificação utilizando Pyspark: na aula 06 chamada "Tratamento de Dados", o professor realiza a transformação de valores de uma coluna categórica "Binária", que possuem tipos string mas com supostamente dois valores únicos, sendo que em algumas colunas temos na verdade três valores únicos.
Como esse processo de identificação de colunas categóricas é feito? É de forma manual ou de forma automática? Como identificamos colunas consideradas "binárias", com apenas dois valores únicos?