1
resposta

Url no Pandas para acompanhar tabela

Olá,

Tentei utilizar o código:


df_html = pd.read_html('https://unafiscosaude.org.br/site/tabelas-de-precos-dos-planos-ativos-para-comercializacao/')
df_html[0]

Porém apareceu o erro abaixo:


ImportError                               Traceback (most recent call last)
Cell In[11], line 1
----> 1 df_html = pd.read_html('https://unafiscosaude.org.br/site/tabelas-de-precos-dos-planos-ativos-para-comercializacao/')
      2 df_html[0]

File ~/anaconda3/lib/python3.11/site-packages/pandas/util/_decorators.py:331, in deprecate_nonkeyword_arguments.<locals>.decorate.<locals>.wrapper(*args, **kwargs)
    325 if len(args) > num_allow_args:
    326     warnings.warn(
    327         msg.format(arguments=_format_argument_list(allow_args)),
    328         FutureWarning,
    329         stacklevel=find_stack_level(),
    330     )
--> 331 return func(*args, **kwargs)

File ~/anaconda3/lib/python3.11/site-packages/pandas/io/html.py:1205, in read_html(io, match, flavor, header, index_col, skiprows, attrs, parse_dates, thousands, encoding, decimal, converters, na_values, keep_default_na, displayed_only, extract_links)
   1201 validate_header_arg(header)
   1203 io = stringify_path(io)
-> 1205 return _parse(
   1206     flavor=flavor,
   1207     io=io,
   1208     match=match,
   1209     header=header,
   1210     index_col=index_col,
   1211     skiprows=skiprows,
   1212     parse_dates=parse_dates,
   1213     thousands=thousands,
   1214     attrs=attrs,
   1215     encoding=encoding,
   1216     decimal=decimal,
   1217     converters=converters,
   1218     na_values=na_values,
   1219     keep_default_na=keep_default_na,
   1220     displayed_only=displayed_only,
   1221     extract_links=extract_links,
   1222 )

File ~/anaconda3/lib/python3.11/site-packages/pandas/io/html.py:982, in _parse(flavor, io, match, attrs, encoding, displayed_only, extract_links, **kwargs)
    980 retained = None
    981 for flav in flavor:
--> 982     parser = _parser_dispatch(flav)
    983     p = parser(io, compiled_match, attrs, encoding, displayed_only, extract_links)
    985     try:

File ~/anaconda3/lib/python3.11/site-packages/pandas/io/html.py:931, in _parser_dispatch(flavor)
    929 if flavor in ("bs4", "html5lib"):
    930     if not _HAS_HTML5LIB:
--> 931         raise ImportError("html5lib not found, please install it")
    932     if not _HAS_BS4:
    933         raise ImportError("BeautifulSoup4 (bs4) not found, please install it")

ImportError: html5lib not found, please install it
1 resposta

Olá, Erika, tudo bem? Espero que sim!

Talvez não tenha atualizado a relação de pacotes da biblioteca que você está utilizando, então você pode reiniciar o kernel do notebook?

Se você estiver utilizando o Google Colab, basta ir em Runtime e depois clicar em Restart runtime, como na imagem a seguir:

Captura de tela da barra de opções do Google Colab com fundo preto. Nela, estamos na aba de Runtime, com foco na opção de Restart runtime, ambas destacadas com um retângulo vermelho.

Após reiniciar, execute a célula que estava com erro novamente.

Espero ter ajudado. Se tiver mais alguma dúvida, estou à disposição.

Grande abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software