1
resposta

[Sugestão] Regex e acentuações

No projeto 1 passado na etapa 3 do curso, é solicitado para que faça o tratamento da coluna "Cliente" no projeto de Vendas Online. Porém, alguns clientes podem ter nome com acentuação o que acabaria excluindo uma letra de um nome de alguns clientes.

Por exemplo: Na linha 9 do DataFrame o cliente "joão gabriel" teria o caractere "ã" excluído utilizando a resposta dada pelo instrutor resultando em "joo gabriel".

dados['Cliente'].str.replace('[^a-z ]', '', regex=True)

Para solucionar isso, é possível adicionar mais uma clausula do Regex que permite caracteres pontuados, conforme abaixo:

dados['Cliente'].str.replace('[^a-zà-ü ]', '', regex=True)

Outra forma para corrigir esse problema seria substituindo "ã" por "a" utilizando o método .replace()

1 resposta

Oi, Marcelo! Tudo bem?

Muito obrigada por compartilhar a sua sugestão com a gente aqui no fórum, ela é super válida e muito importante para tornar a nossa comunidade mais forte, ajudando muitos alunos que possam estar com dúvidas!

Somado a isso, caso tenha restado alguma dúvida, sinta-se à vontade em comunicar, estou à disposição!

Um forte abraço e bons estudos!