Erro para ler o arquivo

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

6
respostas

por MARILIA AMARAL MARCONDES

| 54.3k xp | 37 posts

Já vi que tem várias pessoas com a mesma dúvida. O problema é que não tem resposta...

Não consigo ler o arquivo. Seria possível disponibilizar o arquivo CSV do professor ou nos explicar como fazer quando nos depararmos com problemas assim no dataset?

Outra coisa, por que não fazer uma aula de correção, já que tanta gente não conseguiu acessar o arquivo?

Para mim, aparece o seguinte erro:


---------------------------------------------------------------------------
ParserError                               Traceback (most recent call last)
<ipython-input-12-2020db379281> in <module>
----> 1 resenha = pd.read_csv("imdb-reviews-pt-br.csv")

8 frames
/usr/local/lib/python3.7/dist-packages/pandas/_libs/parsers.pyx in pandas._libs.parsers.raise_parser_error()

ParserError: Error tokenizing data. C error: **Expected 4 fields in line 808, saw 5**

6 respostas

solução!

por Bruno Raphaell

| 366.6k xp | 449 posts

10/11/2022

Olá, Marilia! Tudo bem com você?

Upei o dataset utilizado no curso para um repositório do GitHub para você fazer o download, encontra-se disponível nesse link.

Relacionado a aula de correção vou entrar em contato com o setor responsável e em breve estará na plataforma. Muito obrigado pelo feedback.

Bons estudos.

por MARILIA AMARAL MARCONDES

| 54.3k xp | 37 posts

11/11/2022

Também não funciona. Mesmo erro. Eu tinha feito o download errado (do Git), por isso que parecia ter funcionado... Lamentável essa desconsideração com os alunos... Poderia ao menos explicar como sanar esse erro.

por Francisco Braz Brenha Ribeiro

| 621.6k xp | 14 posts

26/11/2022

Oi... Tive o mesmo problema quando tentei rodar os notebooks ... Estou usando o Windows 10. Minha solução foi acrescentar o path completo da localização física do arquivo. No notebook da aula está "dados/arquivo.csv" e consegui acessar usando "d:/Linguagem Natural Parte 1/dados/arquivo.csv".

Verifique no explorador de arquivos do seu sistema onde o csv está localizado e copie todo o endereço dele.

Dá retorno, ok??

por livia

| 24.7k xp | 1 posts

03/12/2022

Bom dia

Também estou com o mesmo problema .

Não consegui nenhuma solução

por Iury Pedroso da Silva

| 19.4k xp | 1 posts

03/12/2022

Oi, Marilia! Estou fazendo o meu pelo Google Colab. Estava tendo o mesmo problema, mas consegui resolver. Baixando o CSV direto do Kaggle e extraindo o zip, você verá que o arquivo CSV é gigante, mais de 100MB. Ao jogar o arquivo para o Google Colab, ele passa por 2 processos: Fazer o upload e Preparar o arquivo para usá-lo. Este último leva um tempo considerável para terminar, devido o seu tamanho. Perceba que, ao terminar o upload, o arquivo aparecerá no gerenciador de arquivos, mas ao tentar usá-lo, enfrentará erros. Isso acontece porque o Colab ainda não terminou de prepará-lo.

Na coluna Files, à esquerda, no canto inferior, você verá as informações de consumo do disco. Note que acima dele estará aparecendo o nome do arquivo e uma bolinha de progresso laranja sendo preenchida. Isso é o colab preparando o arquivo par ser usado. Após concluir o processo, você conseguirá usá-lo normalmente.

Espero ter conseguido ajudar.

Abraço. IP.

por MARILIA AMARAL MARCONDES

| 54.3k xp | 37 posts

04/12/2022

Francisco, ainda não fiz o seu teste, mas o do Iury também não deu certo.

Estava tentando carregar um arquivo outro dia no Colab e deu o mesmo erro. Tentei no Jupyter e funcionou.

como o professor fala que fez no Jupyter talvez seja uma solução.

Uma coisa que fiz no outro curso e resolvi tentar foi usar a GPU. e deu certo. Mas tem que esperar o tempo que o Iury comentou. Valeu pela dica! ;-)

Tem que ir em Ambiente de Execuão - Alterar o tipo de ambiente de execução - Acelerador de HW - GPU.

Ele funciona por até 12h.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP