1
resposta

[Sugestão] Resolução Desafio

dados.head()

#precisa padronizar o tamanho das letras
dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.lower()

#limpar todos os caracteres que nao sao dados textuais, numerais ou hifens e aspa simples
dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.replace('[^a-zA-Z0-9\-\']',' ', regex=True)

#tokenizando as strings em listas
dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.split()

dados.head()
1 resposta

Isso aí, Gabriel :)

Sua solução está ótima, parabéns pela solução do desafio.

Continue praticando.

Abraços.