1
resposta

Linha de CSV com \n quebra de linha.

Boa tarde pessoal, de que forma eu faria para o pandas ler um csv a qual existem quebras de linha ao decorrer do arquivo.

Ex:

"Nome";"NomeMeio";"Sobrenome"
"Ana";"Karolina";"Silva"
"wesley";"borges
\n";"Conceição"
1 resposta

Olá, Wesley. Tudo bom?

Você pode fazer a leitura especificando o separado ";" e ele vai transformar em um DataFrame com os seus dados, por exemplo:

import pandas as pd

path = "/content/teste.txt"

df = pd.read_csv(path, sep = ";")
df

E a saída é:

NomeNomeMeioSobrenome
0AnaKarolinaSilva
1wesleyborges\r\n\nConceição

E pra tratar essa saída, você pode utilizar um tratamento de string sobre as colunas que apresentarem problemas, como por exemplo, na coluna NomeMeio apareceram alguns caracteres de escape que podemos remover utilizando o código:

df['NomeMeio'] = df["NomeMeio"].str.replace('\W\W\W\w', '')
df

E a saída esperada é:

NomeNomeMeioSobrenome
0AnaKarolinaSilva
1wesleyborgesConceição

E um procedimento também recomendável antes de trabalhar com a importação do CSV é fazer o tratamento do arquivo de texto, realizando manipulações para adequar até um formato adequado, pois trabalhar com o dado estruturado é necessário para que as ferramentas funcionem bem.

Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software