1
resposta

Openpyxl e Pandas

Ola pessoal.

Gostaria de saber se tem alguma maneira de extrair dados de uma planilha de excel pelo nome tabela com pandas, openpyxl ou até mesmo outra maneira com o Python ?

Exemplo: Tenho um arquivo que esta com varias tabelas dentro da mesma planilha. Nesse exemplo apenas duas Tabela excel

Se tivesse alguma maneira de extrair os dados pelo nome da tabela, que posso colocar ali em cima em Designer da Tabela seria mais fácil.

Se eu colocar fixo para extrair dos campos A1 ao A5 e A10 ao A14, e por acaso alguém colocar mais uma linha irá bugar o código.

Sou novo aqui na Alura e se eu fiz alguma coisa de errado na hora de postar a pergunta, me desculpem :)

1 resposta

Olá Vitor, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

Não encontrei uma forma fácil de fazer isso através da biblioteca pandas, mas encontrei uma forma de utilizar a openpylx para extrair as informações:

from openpyxl import load_workbook
wb = load_workbook(filename = 'test.xlsx')

tmp = [ws.tables for ws in wb.worksheets]
tbls = [{v.name:v} for t in tmp for v in t.values()]

Dentro do objeto wb.worksheets existe um elemento tables que pode ser acessado.

Fonte: Read table openpylx

Bons estudos!