Estava testando as funções de read_csv com Pandas, mas está dando erro. Como fazer para usar o arquivo? Talvez excluir o cabeçalho? O arquivo parapy.csv está ao final.
O código:
dataset = pd.read_csv('parapy.csv', sep = ';') dataset
O erro:
UnicodeDecodeError Traceback (most recent call last) in () ----> 1 dataset = pd.read_csv('parapy.csv', sep = ';') 2 dataset
4 frames /usr/local/lib/python3.7/dist-packages/pandas/io/parsers.py in init(self, src, *kwds) 2008 kwds["usecols"] = self.usecols 2009 -> 2010 self._reader = parsers.TextReader(src, *kwds) 2011 self.unnamed_cols = self.reader.unnamedcols 2012
pandas/libs/parsers.pyx in pandas.libs.parsers.TextReader.cinit()
pandas/libs/parsers.pyx in pandas.libs.parsers.TextReader.getheader()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in position 1: invalid continuation byte
O arquivo parapy.csv:
DATA MÊS ANO PRODUTO FORMA PGTO QUANTIDADE PREÇO TOTAL 01/01/2018 jan 2018 PRODUTO D CARTÃO DE CRÉDITO 1 89 89 01/01/2018 jan 2018 PRODUTO A BOLETO BANCÁRIO 4 97,5 390 01/01/2018 jan 2018 PRODUTO C BOLETO BANCÁRIO 2 56,9 113,8 01/01/2018 jan 2018 PRODUTO B CARTÃO DE CRÉDITO 1 120 120 01/01/2018 jan 2018 PRODUTO D CARTÃO DE CRÉDITO 1 89 89 01/01/2018 jan 2018 PRODUTO A BOLETO BANCÁRIO 4 97,5 390 01/01/2018 jan 2018 PRODUTO A BOLETO BANCÁRIO 2 97,5 195 01/01/2018 jan 2018 PRODUTO B CARTÃO DE CRÉDITO 1 120 120 01/01/2018 jan 2018 PRODUTO A CARTÃO DE CRÉDITO 2 97,5 195 02/01/2018 jan 2018 PRODUTO C BOLETO BANCÁRIO 2 56,9 113,8 02/01/2018 jan 2018 PRODUTO B CARTÃO DE CRÉDITO 1 120 120 02/01/2018 jan 2018 PRODUTO D CARTÃO DE CRÉDITO 2 89 178 02/01/2018 jan 2018 PRODUTO C CARTÃO DE CRÉDITO 1 56,9 56,9 02/01/2018 jan 2018 PRODUTO A CARTÃO DE CRÉDITO 3 97,5 292,5 02/01/2018 jan 2018 PRODUTO C CARTÃO DE CRÉDITO 1 56,9 56,9 02/01/2018 jan 2018 PRODUTO A CARTÃO DE CRÉDITO 3 97,5 292,5