Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Duvida - Exercicio

Olá pessoal, como vão?

percebi que nossa primeira linha possui valores entre parenteses para descrever o local de vizinhança.

sendo assim modifiquei levemente a parte que retiramos o hífen para colocar esses parenteses:

dados['descricao_vizinhanca'] = dados['descricao_vizinhanca'].str.replace('(?<!\w)-(?!\w)|[()]', ' ', regex=True)

posso seguir dessa maneira ou é algo irrelevante?

Obrigado! :)

1 resposta
solução!

Boa tarde Eduardo! Tudo bem com você?

A modificação que você fez na expressão regular é válida e faz sentido para limpar o texto removendo tanto hifens quanto parênteses. A sua expressão (?<!\w)-(?!\w)|[()] está configurada para substituir hifens que não estão entre palavras e também qualquer parêntese. Pode seguir, sim, dessa maneira.

Ícone de sugestão Para saber mais:

É sempre importante levar em conta o contexto do projeto ou dos dados com os quais você está lidando. Como cientista de dados, uma das suas principais tarefas é realizar a limpeza dos dados, identificando inconsistências ou padrões que precisam ser ajustados ou corrigidos. Essa etapa é serve para garantir que as análises sejam confiáveis.

A boa notícia é que você está no caminho certo! Ter esse olhar crítico para os dados e entender o que é necessário alterar ou manter é uma habilidade bem importante na área de ciência de dados.

Além disso, quando se trata de decidir o que modificar ou não, sempre leve em consideração:

  • Objetivos do projeto: O que a análise precisa responder? Os ajustes nos dados atendem a esses objetivos?
  • Impacto das mudanças: Alterar ou excluir dados pode influenciar significativamente os resultados.
  • Documentação: Sempre registre as alterações realizadas para garantir transparência no processo.

Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado