Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Erro de leitura

Não estou conseguindo ler o arquivo csv disponibilizado no curso

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model  import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.linear_model  import LogisticRegression

movies = pd.read_csv("avaliacoes_usuario.csv")
Traceback (most recent call last):
  File "avalicacoes.py", line 8, in <module>
    movies = pd.read_csv("avaliacoes_usuario.csv")
  File "C:\Users\keple\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\io\parsers.py", line 685, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "C:\Users\keple\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\io\parsers.py", line 463, in _read
    data = parser.read(nrows)
  File "C:\Users\keple\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\io\parsers.py", line 1154, in read
    ret = self._engine.read(nrows)
  File "C:\Users\keple\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\io\parsers.py", line 2059, in read
    data = self._reader.read(nrows)
  File "pandas/_libs/parsers.pyx", line 881, in pandas._libs.parsers.TextReader.read
  File "pandas/_libs/parsers.pyx", line 896, in pandas._libs.parsers.TextReader._read_low_memory
  File "pandas/_libs/parsers.pyx", line 973, in pandas._libs.parsers.TextReader._read_rows
  File "pandas/_libs/parsers.pyx", line 1105, in pandas._libs.parsers.TextReader._convert_column_data
  File "pandas/_libs/parsers.pyx", line 1158, in pandas._libs.parsers.TextReader._convert_tokens
  File "pandas/_libs/parsers.pyx", line 1281, in pandas._libs.parsers.TextReader._convert_with_dtype
  File "pandas/_libs/parsers.pyx", line 1297, in pandas._libs.parsers.TextReader._string_convert
  File "pandas/_libs/parsers.pyx", line 1520, in pandas._libs.parsers._string_box_utf8
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9f in position 24: invalid start byte
1 resposta
solução!

Olá Iago,

O problema é causado pelo encoding do arquivo, que está diferente do padrão utf-8

Por enquanto você pode utilizar o parâmetro encoding do pd.read_csv() para informar manualmente o enconding do arquivo:

movies = pd.read_csv("avaliacoes_usuario.csv", encoding='latin')

Eu vou entrar em contato com a equipe para substituir o arquivo.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software