Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Erro ao ler CSV: ParserError: Error tokenizing data. C error: EOF inside string starting at row 9157

Durante a leitura do arquivo CSV baixado do IMDB no Google Colab, usando os mesmos códigos postados no vídeo do curso, foi dada mensagem de erro:

Insira aqui a descrição dessa imagem para ajudar na acessibilidadeParserError: Error tokenizing data. C error: EOF inside string starting at row 9157

1 - Ao adicionar um encoding para UTF-8, o problema seguiu acontecendo (resenha = pd.read_csv("/content/imdb-reviews-pt-br.csv", encoding='utf8'))

2 - Até consegui achar uma sugestão de alterar a engine, e o erro mudou para:

unexpected end of data Insira aqui a descrição dessa imagem para ajudar na acessibilidade Insira aqui a descrição dessa imagem para ajudar na acessibilidade3 - Outra opção sugerida que encontrei foi colocar um parâmetro error_bad_lines=False e esse finalmente funcionou, mas ele para a leitura na linha 9157 (além de ao que parece pular alguma linha, pois o ID descasou com a linha):

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Vocês sabem como resolver esse problema?

Não estou conseguindo replicar a leitura do arquivo.

1 resposta
solução!

Pessoal, após uma segunda tentativa, descobri que o erro que aconteceu é porque o arquivo não havia sido totalmente carregado na nuvem, no Google Colab, portanto ele ficou incompleto, ao tentar ler.

Com ele completamente subindo (ou usando, puxando de um Google Drive) a forma de leitura do código da aula funcionou corretamente.