Ainda não tem acesso? Estude com a gente! Matricule-se
Ainda não tem acesso? Estude com a gente! Matricule-se

problema do UTF-8 no COLAB

As outras aulas o link .csv estava funcionando normal,apenas essa avaliacoes_usuarios.csv apresenta o erro : UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9f in position 24: invalid start byte

para contornar o problema tentei salvar o arquivo no drive. Apos salvar o arquivo avaliacoes_usuario no google sheets , usei o seguinte codigo:

from google.colab import auth
auth.authenticate_user()

import gspread
from oauth2client.client import GoogleCredentials

gc = gspread.authorize(GoogleCredentials.get_application_default())

worksheet = gc.open('avaliacoes_usuario').sheet1
# get_all_values gives a list of rows.
rows = worksheet.get_all_values()


# Convert to a DataFrame and render.
import pandas as pd
movies = pd.DataFrame.from_records(rows)

ele importa o dataframe porem com a primeira linha sendo [0 ,1 ,2 ... 16] e não [titulo, documentary, sci-fi ... gostou]. Gostaria de saber como eu defino o cabeçalho no dataframe do pandas ?

1 resposta

Olá Vitor tudo bem com você?

Para renomear as colunas do seu DataFrame, utilize este comando conforme exemplo abaixo:

df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
df.rename(columns={"A": "a", "B": "c"})
   a  c
0  1  4
1  2  5
2  3  6

Se a minha resposta te ajudou, fico muito feliz =D e peço que por favor encerre o Post marcando a dúvida como resolvida! Caso precise de ajuda é só voltar aqui e perguntar.

Obrigado

Victor Gonzalez

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software