Boa tarde pessoal, de que forma eu faria para o pandas ler um csv a qual existem quebras de linha ao decorrer do arquivo.
Ex:
"Nome";"NomeMeio";"Sobrenome"
"Ana";"Karolina";"Silva"
"wesley";"borges
\n";"Conceição"
Boa tarde pessoal, de que forma eu faria para o pandas ler um csv a qual existem quebras de linha ao decorrer do arquivo.
Ex:
"Nome";"NomeMeio";"Sobrenome"
"Ana";"Karolina";"Silva"
"wesley";"borges
\n";"Conceição"
Olá, Wesley. Tudo bom?
Você pode fazer a leitura especificando o separado ";" e ele vai transformar em um DataFrame com os seus dados, por exemplo:
import pandas as pd
path = "/content/teste.txt"
df = pd.read_csv(path, sep = ";")
df
E a saída é:
Nome | NomeMeio | Sobrenome | |
---|---|---|---|
0 | Ana | Karolina | Silva |
1 | wesley | borges\r\n\n | Conceição |
E pra tratar essa saída, você pode utilizar um tratamento de string sobre as colunas que apresentarem problemas, como por exemplo, na coluna NomeMeio apareceram alguns caracteres de escape que podemos remover utilizando o código:
df['NomeMeio'] = df["NomeMeio"].str.replace('\W\W\W\w', '')
df
E a saída esperada é:
Nome | NomeMeio | Sobrenome | |
---|---|---|---|
0 | Ana | Karolina | Silva |
1 | wesley | borges | Conceição |
E um procedimento também recomendável antes de trabalhar com a importação do CSV é fazer o tratamento do arquivo de texto, realizando manipulações para adequar até um formato adequado, pois trabalhar com o dado estruturado é necessário para que as ferramentas funcionem bem.
Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!