3
respostas

Error tokenizing data

Na aula 2 do curso de Data Science, qdo coloquei o código que o professor pediu: Terminado o download, descompactaremos otmdb-5000-movie-dataset.zip e extrairemos os arquivos tmdb_5000_credits.csv, que contém os créditos das pessoas que participaram da produção dos filmes (roteiristas, diretores, dentre outros), e tmdb_5000_movies.csv, com informações sobre os filmes em si.

Anexo o código com o erro:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade O que devo fazer quando aparece: Error tokenizing data. C error: Expected 20 fields in line 23, saw 29

3 respostas

Oi Marcos Paulo! Tudo bem com você?

Desculpa a demora em te trazer um retorno.

O Pandas CSV parser tem duas engines diferentes para ler esses arquivos .csv: Python e C. No modo default ele utiliza a C , mas no seu caso está encontrando algum problema para a abertura. Uma possível solução é especificar que quer a engine Python, dessa forma:

tmdb = pd.read_csv('tmdb_5000_movies.csv', engine= 'python')

Depois você pode me informar se fazendo esse ajuste o erros sumiu?

Fico no aguardo do seu retorno!

Não deu certo !!!

Deu outro erro: Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Oi Marcos!

Esse erro aconteceu porque ao sair do Google Colab ou ficar muito tempo sem utilizá-lo o ambiente criado para desenvolver o projeto é esquecido, isso quer dizer que o código montado nas outras células não foi executado pelo Colab e o ambiente não vai reconhecer as variáveis que foram colocadas anteriormente. Por conta disso, a mensagem de erro informava que pd não era uma variável reconhecida mesmo tendo um código importando o pandas como pd.

Isso é algo muito comum em notebooks Python e resolver esse problema é bem simples, você precisará apenas executar todas as células antes de começar onde parou. Para fazer isso, vá na barra superior do Google Colab, clique na opção "Ambiente de Execução" e depois selecione a opção "Reiniciar e executar tudo"

Texto alternativo: Barra superior de opções do ambiente do Google Colab com um retângulo de contorno vermelho sem preenchimento que enfatiza a opção "Ambiente de execução" e uma seta vermelha aponta para a opção "Reiniciar e executar tudo"

Após a execução de todas as células, você pode observar se o erro persiste e me informar aqui ^^

No aguardo do seu retorno!