Durante a leitura do arquivo CSV baixado do IMDB no Google Colab, usando os mesmos códigos postados no vídeo do curso, foi dada mensagem de erro:
ParserError: Error tokenizing data. C error: EOF inside string starting at row 9157
1 - Ao adicionar um encoding para UTF-8, o problema seguiu acontecendo (resenha = pd.read_csv("/content/imdb-reviews-pt-br.csv", encoding='utf8'))
2 - Até consegui achar uma sugestão de alterar a engine, e o erro mudou para:
unexpected end of data 3 - Outra opção sugerida que encontrei foi colocar um parâmetro error_bad_lines=False e esse finalmente funcionou, mas ele para a leitura na linha 9157 (além de ao que parece pular alguma linha, pois o ID descasou com a linha):
Vocês sabem como resolver esse problema?
Não estou conseguindo replicar a leitura do arquivo.