1
resposta

Atividade tokenização 'descricao_vizinhanca'

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Oi, Adriely! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Você aplicou muito bem a sequência de substituições com regex para limpar o texto e depois dividir em listas. Continue assim! ✨

Uma dica interessante para o futuro é usar o método str.findall para extrair apenas as palavras desejadas sem precisar dividir depois. Veja este exemplo:


dados["coluna"] = dados["coluna"].str.findall(r"[a-zA-Z0-9]+")

Esse código coleta somente os grupos de caracteres alfanuméricos e retorna tudo em forma de lista.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!