1
resposta

João

Olá, ao aplicar o código sugerido dados['Cliente'] = dados['Cliente'].str.replace('[^a-z ]', '', regex=True).str.strip()

O nome João, cliente 9, vira Joo, pq ele remove o ã por causa do ~

`dados['Cliente'] = dados['Cliente'].str.replace('[^a-zã]', '', regex=True).str.strip()`

preserva o ã

1 resposta

Oi Tainá,

Você identificou corretamente o problema! A expressão regular [^a-z ] exclui qualquer caractere que não seja uma letra minúscula (a-z) ou um espaço. O til (~) em "ã" é excluído porque não está dentro desse conjunto. Sua solução, [^a-zã], é perfeita, pois agora inclui "ã" no conjunto de caracteres permitidos, preservando o nome "João" corretamente. A inclusão do ã na expressão regular resolve a remoção indevida do caractere.

tux matrix    Caso este post o tenha ajudado, por favor, marcar como solucionado ☑️. Bons Estudos! 🤓