1
resposta

tokenizacao

Usando o codigo da professora, dados['descricao_local'].str.replace('^a-zA-Z0-9\-\']',' ', regex=True), o meu texto nao saiu como o dela Insira aqui a descrição dessa imagem para ajudar na acessibilidade

O que eu notei foi que a aspas duplas nao foram eliminadas (em ..."studio at mibbett hollow') ou o * que aparece em (...features: *...) Ou os dois pontos. Como faço pra eliminá-los tambem?

1 resposta

Vc pode fazer mudanças pra remover as aspas e *

dados['descricao_local'].str.replace(r'[^a-zA-Z0-9\s\-\']|["*:]', '', regex=True)

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software