Ainda não tem acesso? Estude com a gente! Matricule-se
Ainda não tem acesso? Estude com a gente! Matricule-se

erro na leitura do arquivo

este post é para vc que teve o mesmo erro que eu:

o erro:

ParserError: Error tokenizing data. C error: EOF inside string starting at row 32560

para solução do erro usei a enconding 'UTF-8 '

1 resposta

Olá Edu.

Legal, obrigado por dividir sua solução com o pessoal.

Fiz uma busca e encontrei que isso pode acontecer as vezes quando o arquivo CSV foi salvo no Excel e dessa maneira o Pandas não consegue fazer a leitura corretamente.

Na documentação do pandas podemos encontrar o parâmetro encoding e dessa maneira podemos definir que a leitura deve ser feita utilizando o UTF-8.

resenha = pd.read_csv("dados/imdb-reviews-pt-br.csv", encoding='utf-8')

Bons Estudos e parabéns pela iniciativa.