Minha dúvida é a seguinte, vendo o curso, tentei aplicar parte dele em um data frame real, no qual trabalho e um ponto que me deparei, que também já me deparei em outros cursos é a parte da conversão de string para sequêncial numérico. Ou seja, hipoteticamente você têm uma coluna com cores, por exemplo, cores amarelo, vermelho e azul e precisa converter isso dinamicamente para 1, 2 e 3. Mas preciso fazer isso dinamicamente, sem um "de para" manual via dicionário, pois em produção e escala essa opção não é factível. Nesse caso, meu ponto de dúvida é como é algo comum de precisarmos fazer em praticamente todos os MLs que faremos ao longo da carreira, existe alguma lib que já tenha uma função pronta para fazer isso ? Pois no dia a dia, será necessário sempre recursos dinâmicos, por isso a minha dúvida se sefaz necessário fazer uma função para esta situação, ou se existe algo pronto nas libs para isso ?
Obs.: Ponto importante no ambiente utilizamos data frames em pyspark. Então coloquei a minha dúvida aqui, pois pode ser a dúvida de outros alunos também.
Obrigado pelo apoio !