Solucionado (ver solução)
Solucionado
(ver solução)
6
respostas

[Bug] Pandas Seleção e agrupamento de dados – Leitura de dados *falha ao ler xlsx

Pessoal, não consigo importar o arquivo de jeito algum, e já fiz no curso anterior como importar no pandas para praticamente todos os tipos de arquivos

import pandas as pd
emissoes_gases = pd.read_excel('/content/drive/MyDrive/1-SEEG10_GERAL-BR_UF_2022.10.27-FINAL-SITE.xlsx', sheet_name = 'GEE Estados')

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

6 respostas

coloca o erro todo por favor para poder analisar

Bom dia Francisco, Pelo que pude ver é um erro recorrente tem mais um pessoal reclamanto da mesma falha. Segue toda a exceção abaixo:

BadZipFile                                Traceback (most recent call last)
<ipython-input-2-91e92c0bac6a> in <cell line: 1>()
----> 1 emissoes_gases = pd.read_excel('/content/1-SEEG10_GERAL-BR_UF_2022.10.27-FINAL-SITE.xlsx', sheet_name = 'GEE Estados')

6 frames
/usr/local/lib/python3.10/dist-packages/pandas/util/_decorators.py in wrapper(*args, **kwargs)
    209                 else:
    210                     kwargs[new_arg_name] = new_arg_value
--> 211             return func(*args, **kwargs)
    212 
    213         return cast(F, wrapper)

/usr/local/lib/python3.10/dist-packages/pandas/util/_decorators.py in wrapper(*args, **kwargs)
    329                     stacklevel=find_stack_level(),
    330                 )
--> 331             return func(*args, **kwargs)
    332 
    333         # error: "Callable[[VarArg(Any), KwArg(Any)], Any]" has no

/usr/local/lib/python3.10/dist-packages/pandas/io/excel/_base.py in read_excel(io, sheet_name, header, names, index_col, usecols, squeeze, dtype, engine, converters, true_values, false_values, skiprows, nrows, na_values, keep_default_na, na_filter, verbose, parse_dates, date_parser, thousands, decimal, comment, skipfooter, convert_float, mangle_dupe_cols, storage_options)
    480     if not isinstance(io, ExcelFile):
    481         should_close = True
--> 482         io = ExcelFile(io, storage_options=storage_options, engine=engine)
    483     elif engine and engine != io.engine:
    484         raise ValueError(

/usr/local/lib/python3.10/dist-packages/pandas/io/excel/_base.py in __init__(self, path_or_buffer, engine, storage_options)
   1650                 ext = "xls"
   1651             else:
-> 1652                 ext = inspect_excel_format(
   1653                     content_or_path=path_or_buffer, storage_options=storage_options
   1654                 )

/usr/local/lib/python3.10/dist-packages/pandas/io/excel/_base.py in inspect_excel_format(content_or_path, storage_options)
   1541             return None
   1542 
-> 1543         with zipfile.ZipFile(stream) as zf:
   1544             # Workaround for some third party files that use forward slashes and
   1545             # lower case names.

/usr/lib/python3.10/zipfile.py in __init__(self, file, mode, compression, allowZip64, compresslevel, strict_timestamps)
   1265         try:
   1266             if mode == 'r':
-> 1267                 self._RealGetContents()
   1268             elif mode in ('w', 'x'):
   1269                 # set the modified flag so central directory gets written

/usr/lib/python3.10/zipfile.py in _RealGetContents(self)
   1332             raise BadZipFile("File is not a zip file")
   1333         if not endrec:
-> 1334             raise BadZipFile("File is not a zip file")
   1335         if self.debug > 1:
   1336             print(endrec)

BadZipFile: File is not a zip file

Ok, já entendi o problema faz um pip install openpyxl isso deve resolver

Não foi ainda cara. Não sei se ficou claro a falha esta acontecendo no google colab. Por desencargo eu tentei no PyCharm, e acredite se quiser funcionou. Mas mesmo assim seria legal se descobrissemos o pq dessa falha né, tem um tópico aqui de um Mês atrás sobre a mesma falha.

Nas pesquisas que fiz vi que é um bug da plataforma do Colab, a solução que encontraram foi subir o arquivo no Google Drive e depois ir para o Colab ai conseguem ler corretamente

solução!

Bom dia francisco,

Cara realmente é subir no Drive, porém não como os professores estão fazendo nas aulas. Eu fiz no curso de Pandas e no de Spark e não funcionaram, então resolvi importar os arquivo direto no Google Drive ao invez de importa - los pelo Colab. E partir dai funcinou que é uma beleza, muito obrigado ai pelas dicas