1
resposta

Leitura de tabela pelo HTML da página

Olá, Na aula sobre Importar dados de outras fontes do curso: Python Pandas: tratando e analisando dados é ensinado que podemos ler e importar uma tabela direto de uma página html - usando o Jupyter. Mas ao digitar o código e colar os links da página, dá um erro e não é possível importar a tabela. (Fiz testes com 3 páginas diferentes). Já tentei instalar: pip install lxml html5lib, mas nada funcionou.

Veja o erro: Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, Amanda! Tudo bom?

A mensagem do traceback é sobre a abordagem de leitura pd.read_html() ficará obsoleta no futuro. Mas recomendo que faça algumas revisões:

  • Veja se a URL https://www.bcb.gov.br/controleninflacao/historicotaxasjuros é válida e acessível. Abra-a em um navegador para confirmar se há tabelas HTML visíveis. Ao invés de passar a URL, você pode baixar o conteúdo HTML e passá-lo como string, isso te dará mais controle sobre o arquivo de download.
  • Vi que instalou as bibliotecas, lxml, html5lib, instale também a beautifulsoup4 e requests. Porque pd.read_html() depende delas para parsear HTML
  • E tente reiniciar o kernel do Jupyter (como sugerido na mensagem).

Se o erro persistir, por favor, envie o traceback completo ou mais detalhes sobre o erro específico, dessa forma, ajudará a identificar a causa exata.

Espero que as sugestões sejam uteis e até mais, Amanda!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!