1
resposta

Carregar a planilha para o pandas

Olá professora,

Estou com uma dúvida,
Tenho uma planilha com centenas de dados, mas elá não está no github, está salva no meu pc. Para poder trabalhar com o pandas, eu preciso salvar ela como csv e jogar no github, para usar a variável no url = 'xxxxx' ?

1 resposta

Ei, Alexandre! Tudo bem?

Agradeço por aguardar o nosso retorno.

Para fazer igual à aula, está é uma opção de carregar os seus dados. Mas não precisa, necessariamente, salvar sua planilha como CSV e colocá-la no GitHub. Como ela já está no seu computador, você pode carregá-la diretamente no Colab e usar o caminho do arquivo no Pandas.

Abaixo tem um exemplo de como usar o arquivo diretamente no seu computador sem hospedar o link no Gitthub:

  • Primeiro, faça o upload dela no seu notebook, caso esteja usando o Colab clique em Arquivos > Upload:

Interface do painel lateral esquerdo de arquivos em um ambiente de notebook, com a pasta csv selecionada e destacada em verde contendo o arquivo distritos_sp.csv, e na barra de ferramentas superior o botão de upload marcado com o número 2 exibindo o tooltip fazer upload para o armazenamento da sessão ao passar o mouse.

  • Depois, use a função read_csv do Pandas, se seu arquivo estiver em `CSV, para carregá-la diretamente.
import pandas as pd

# Substitua 'caminho/para/sua/planilha.csv' pelo caminho que está no notebook
df = pd.read_csv('caminho/para/sua/planilha.csv')

print(df.head())  # Isso irá mostrar as primeiras linhas do seu DataFrame

E para copiar o caminho do arquivo para colocar no código acima, clique nos 3 pontinhos do arquivo que realizou o upload e selecionar Copiar Caminho:

Painel lateral de arquivos aberto com o arquivo distritos_sp.csv selecionado, exibindo um menu de contexto aberto ao clicar nos três pontinhos, onde a opção Copiar caminho está destacada com contorno verde e marcada com o número 4, enquanto os três pontinhos que abriram o menu estão indicados com o número 3.

Se a sua planilha estiver em outro formato, como Excel, você pode usar a função read_excel:

import pandas as pd

# Substitua 'caminho/para/sua/planilha.xlsx' pelo caminho real do arquivo no seu computador
df = pd.read_excel('caminho/para/sua/planilha.xlsx')

print(df.head())  # Isso irá mostrar as primeiras linhas do seu DataFrame

Espero ter ajudado e qualquer dúvida, compartilhe no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!