Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

UnicodeDecodeError em arquivo csv do Excel

Estava testando as funções de read_csv com Pandas, mas está dando erro. Como fazer para usar o arquivo? Talvez excluir o cabeçalho? O arquivo parapy.csv está ao final.

O código:

dataset = pd.read_csv('parapy.csv', sep = ';') dataset

O erro:


UnicodeDecodeError Traceback (most recent call last) in () ----> 1 dataset = pd.read_csv('parapy.csv', sep = ';') 2 dataset

4 frames /usr/local/lib/python3.7/dist-packages/pandas/io/parsers.py in init(self, src, *kwds) 2008 kwds["usecols"] = self.usecols 2009 -> 2010 self._reader = parsers.TextReader(src, *kwds) 2011 self.unnamed_cols = self.reader.unnamedcols 2012

pandas/libs/parsers.pyx in pandas.libs.parsers.TextReader.cinit()

pandas/libs/parsers.pyx in pandas.libs.parsers.TextReader.getheader()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in position 1: invalid continuation byte

O arquivo parapy.csv:

DATA MÊS ANO PRODUTO FORMA PGTO QUANTIDADE PREÇO TOTAL 01/01/2018 jan 2018 PRODUTO D CARTÃO DE CRÉDITO 1 89 89 01/01/2018 jan 2018 PRODUTO A BOLETO BANCÁRIO 4 97,5 390 01/01/2018 jan 2018 PRODUTO C BOLETO BANCÁRIO 2 56,9 113,8 01/01/2018 jan 2018 PRODUTO B CARTÃO DE CRÉDITO 1 120 120 01/01/2018 jan 2018 PRODUTO D CARTÃO DE CRÉDITO 1 89 89 01/01/2018 jan 2018 PRODUTO A BOLETO BANCÁRIO 4 97,5 390 01/01/2018 jan 2018 PRODUTO A BOLETO BANCÁRIO 2 97,5 195 01/01/2018 jan 2018 PRODUTO B CARTÃO DE CRÉDITO 1 120 120 01/01/2018 jan 2018 PRODUTO A CARTÃO DE CRÉDITO 2 97,5 195 02/01/2018 jan 2018 PRODUTO C BOLETO BANCÁRIO 2 56,9 113,8 02/01/2018 jan 2018 PRODUTO B CARTÃO DE CRÉDITO 1 120 120 02/01/2018 jan 2018 PRODUTO D CARTÃO DE CRÉDITO 2 89 178 02/01/2018 jan 2018 PRODUTO C CARTÃO DE CRÉDITO 1 56,9 56,9 02/01/2018 jan 2018 PRODUTO A CARTÃO DE CRÉDITO 3 97,5 292,5 02/01/2018 jan 2018 PRODUTO C CARTÃO DE CRÉDITO 1 56,9 56,9 02/01/2018 jan 2018 PRODUTO A CARTÃO DE CRÉDITO 3 97,5 292,5

1 resposta
solução!

Já encontrei o erro. Resolveu usando o encoding = "cp1252") dataset = pd.read_csv('parapy.csv', sep = ';', encoding = "cp1252") dataset

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software