Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Html literal para 'read_html' ficou obsoleto

Estou fazendo a trilha data science e tava fazendo o Web Scraping, no curso ensina certinho, mas recebi um warning do jupyter dizendo que passar um html literal para o método read_html ficou obsoleto e vai ser removido numa atualização posterior. Qual seria uma forma alternativa do trecho "df = pd.read_html(html_file)"? Não entendi o que o warning sugeriu de alternativa, vou ficar agradecido se explicarem!!! Abraços <3. (Obs: curso em questão é o Python Pandas: tratando e analisando dados)!!Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta
solução!

Olá, Davi, tudo bem?

Segundo a documentação, a função pandas.read_html foi depreciada a partir da 2.1.0.

Para solucionar o problema, você pode seguir os passos abaixo:

  1. Fazer downgrade da versão do pandas para a 1.4 por exemplo pip install pandas==1.4.0.

  2. Como indicado no FutureWarning, você deverá usar o objeto StringIO para envolver a string HTML antes de passá-la para o read_html, para isso execute:

from io import StringIO
df = pd.read_html(StringIO(html_file))

Feito isso, o código rodará normalmente:

Captura de tela do Jupyter Notebook. Há um trecho de código e uma seta apontando para a variavel 'df = pd.read_html(StringIO(html_file))'

Espero ter ajudado.

Caso surja alguma dúvida, é só compartilhar no fórum.

Abraços e até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!