1
resposta

[Sugestão] Simplificando o tratamento dos dados com Regex

Olá ! Passando para compartilhar uma forma alternativa de fazer o replace para o tratamento dos dados!

  • para identificar os não numéricos utilizei a Regex '\D'.

  • o método replace recebe um dicionário {'(\d{1,2})' : '','.' : ''} como todas as tratativas, onde a chave contém a expressão e o valor recebe o conteúdo a ser substituído, com isso em um mesmo replace faço as duas substituições

populacao_estados['populacao']=populacao_estados['POPULAÇÃO'].replace({'(\d{1,2})':'','.':''},regex=True).astype('int64')

populacao_estados[populacao_estados['POPULAÇÃO'].str.contains('\D').notna()]

Espero ter contribuído!

Abraços

1 resposta

Oi, Jean! Tudo bem?

Obrigada por compartilhar sua sugestão com a gente aqui no fórum! Tenho certeza que o seu conhecimento compartilhado irá somar bastante no aprendizado da nossa comunidade. Realmente, o método utilizado simplifica bastante o tratamento dos dados, fazendo todas as substituições em uma única linha de código.

A sua sugestão de usar a expressão regular '\D' para identificar os não numéricos é muito útil. Além disso, a ideia de passar um dicionário para o método replace, onde a chave contém a expressão e o valor recebe o conteúdo a ser substituído, é uma excelente maneira de otimizar o código.

Somado a isso, caso reste alguma dúvida em relação ao conteúdo do curso, sinta-se à vontade em comunicar, estou à disposição e ficarei super feliz em poder ajudar!

Um forte abraço e bons estudos!