0
respostas

[Dúvida] Acessar diversas planilhas do google em lotes

Estou trabalhando em um projeto que eu preciso acessar diversas planilhas em sequência e transformá-las em DataFrames. Para isso, estou usando a biblioteca "os" para iterar pela pasta buscando os arquivos, extrair o caminho do arquivo e usar esse caminho para acessar a planilha. Esse código foi montado com a ajuda da IA pois não tenho grandes conhecimentos na biblioteca os. Porém, eu gostaria de aplicar da mesma forma à planilhas do google (formato gsheets) e, como demonstrado na aula, para acessar as planilhas é preciso dos links individualmente, porém preciso processá-las em lotes. Poderiam me dar uma luz?

O código para processar arquivos xsls está abaixo:

import os
import pandas as pd

folder_path = [STRING COM O CAMINHO DA PASTA QUE TEM OS ARQUIVOS NO GOOGLE DRIVE MONTADO NO COLAB]
# Iterar em cada arquivo obtendo nome, para assim criar o caminho (variável file_path)
for file_name in os.listdir(folder_path):
    if file_name.endswith('.xlsx'):  # Verifica se é um arquivo XLSX
        file_path = os.path.join(folder_path, file_name)
        print(f"Lendo arquivo: {file_name}")
        # Ler o arquivo xlsx com pandas
        # Quero ler apenas só a primeira planilha do arquivo que tenham "AB" no nome
        relatorio = [nome for nome in pd.ExcelFile(file_path).sheet_names if "AB" in nome]
        df = read_excel(file_path, sheet_name=relatorio[0])