dados.head()
#precisa padronizar o tamanho das letras
dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.lower()
#limpar todos os caracteres que nao sao dados textuais, numerais ou hifens e aspa simples
dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.replace('[^a-zA-Z0-9\-\']',' ', regex=True)
#tokenizando as strings em listas
dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.split()
dados.head()