1
resposta

Bibliotecas html5lib e lxml: para que servem?

Olá.

Na aula o prof. usa o pip3 install para essas duas bibliotecas: html5lib e lxml. No entanto, não vi seu uso durante os dois vídeos da aula atual. Para que elas servem? Seu uso vai aparecer mais para frente no curso, ou elas são necessárias para o pd.read_html?

Obrigado.

1 resposta

Olá, Matheus! Tudo bom?

Desculpe pela demora em obter um retorno.

Para que o Pandas possa trabalhar com o HTML são necessárias essas duas bibliotecas adicionais, a lxml, e a html5lib. O método que trabalha com a leitura de HTML que foi utilizado no curso nas próximas aulas é o pd.read_html(), então nós já utilizamos as bibliotecas indiretamente. Atualmente essas duas bibliotecas já estão disponíveis no Google Colab, sem que seja necessário instalar manualmente. Você pode verificar todas as bibliotecas disponíveis no Colab escrevendo em uma célula e executando o comando:

!pip freeze

Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!