Solucionado (ver solução)
Solucionado
(ver solução)
6
respostas

Erro para ler o arquivo

Já vi que tem várias pessoas com a mesma dúvida. O problema é que não tem resposta...

Não consigo ler o arquivo. Seria possível disponibilizar o arquivo CSV do professor ou nos explicar como fazer quando nos depararmos com problemas assim no dataset?

Outra coisa, por que não fazer uma aula de correção, já que tanta gente não conseguiu acessar o arquivo?

Para mim, aparece o seguinte erro:


---------------------------------------------------------------------------
ParserError                               Traceback (most recent call last)
<ipython-input-12-2020db379281> in <module>
----> 1 resenha = pd.read_csv("imdb-reviews-pt-br.csv")

8 frames
/usr/local/lib/python3.7/dist-packages/pandas/_libs/parsers.pyx in pandas._libs.parsers.raise_parser_error()

ParserError: Error tokenizing data. C error: **Expected 4 fields in line 808, saw 5**
6 respostas
solução!

Olá, Marilia! Tudo bem com você?

Upei o dataset utilizado no curso para um repositório do GitHub para você fazer o download, encontra-se disponível nesse link.

Relacionado a aula de correção vou entrar em contato com o setor responsável e em breve estará na plataforma. Muito obrigado pelo feedback.

Bons estudos.

Também não funciona. Mesmo erro. Eu tinha feito o download errado (do Git), por isso que parecia ter funcionado... Lamentável essa desconsideração com os alunos... Poderia ao menos explicar como sanar esse erro.

Oi... Tive o mesmo problema quando tentei rodar os notebooks ... Estou usando o Windows 10. Minha solução foi acrescentar o path completo da localização física do arquivo. No notebook da aula está "dados/arquivo.csv" e consegui acessar usando "d:/Linguagem Natural Parte 1/dados/arquivo.csv".

Verifique no explorador de arquivos do seu sistema onde o csv está localizado e copie todo o endereço dele.

Dá retorno, ok??

Bom dia

Também estou com o mesmo problema .

Não consegui nenhuma solução

Oi, Marilia! Estou fazendo o meu pelo Google Colab. Estava tendo o mesmo problema, mas consegui resolver. Baixando o CSV direto do Kaggle e extraindo o zip, você verá que o arquivo CSV é gigante, mais de 100MB. Ao jogar o arquivo para o Google Colab, ele passa por 2 processos: Fazer o upload e Preparar o arquivo para usá-lo. Este último leva um tempo considerável para terminar, devido o seu tamanho. Perceba que, ao terminar o upload, o arquivo aparecerá no gerenciador de arquivos, mas ao tentar usá-lo, enfrentará erros. Isso acontece porque o Colab ainda não terminou de prepará-lo.

Na coluna Files, à esquerda, no canto inferior, você verá as informações de consumo do disco. Note que acima dele estará aparecendo o nome do arquivo e uma bolinha de progresso laranja sendo preenchida. Isso é o colab preparando o arquivo par ser usado. Após concluir o processo, você conseguirá usá-lo normalmente.

Espero ter conseguido ajudar.

Abraço. IP.

Francisco, ainda não fiz o seu teste, mas o do Iury também não deu certo.

Estava tentando carregar um arquivo outro dia no Colab e deu o mesmo erro. Tentei no Jupyter e funcionou.

como o professor fala que fez no Jupyter talvez seja uma solução.

Uma coisa que fiz no outro curso e resolvi tentar foi usar a GPU. e deu certo. Mas tem que esperar o tempo que o Iury comentou. Valeu pela dica! ;-)

Tem que ir em Ambiente de Execuão - Alterar o tipo de ambiente de execução - Acelerador de HW - GPU.

Ele funciona por até 12h.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade