1
resposta

[Dúvida] Espaço duplicado

Eu acho que depois da palavra 'hash' ficou com um espaço duplicado:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Ei, William! Tudo bem?

Obrigada por sinalizar sobre! Isso pode acontecer por diversos motivos, como uma substituição de caracteres que acabou gerando espaços extras. Existem vários tipos de Whitespace, como: quebra de linha, tab, retorno, etc. Eles não aparecem visualmente, mas continuam presentes, aparentando um espaço.

Situações mais comuns de aparecer um whispace:

  • páginas web;
  • PDFs, onde há muitos caracteres invisíveis;
  • cópias de documentos do Word;
  • parsers de texto que adicionam delimitadores;
  • limpeza prévia de texto que deixa resíduos.

Uma solução é usar o rstrip() para remover todos os tipos de whitespace diretamente no dataframe. Execute o código abaixo no seu notebook:

dados_portugues.loc[0, 'questoes_tratadas'] = dados_portugues.loc[0, 'questoes_tratadas'].rstrip()

Depois dê um print para ver o retorno:

dados_portugues.questoes_tratadas[0]

Segue um print de como ficou aqui no meu teste:

Captura de tela de um editor de código mostrando duas linhas em Python: na primeira, o comando dados_portugues.locabrecolchete0, 'questoes_tratadas'fechacolchete = dados_portugues.locabrecolchete0, 'questoes_tratadas'fechacolchete.rstripabre e fecha parenteses remove espaços em branco à direita de uma string. Abaixo, aparece o conteúdo da célula 0 da coluna "questoes_tratadas", um longo parágrafo em português sobre segurança de senhas, com a palavra "esse" sublinhada em vermelho no final do texto.

Espero ter ajudado e qualquer dúvida, compartilhe no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!