import pandas as pd
dados_html = pd.read_html("/content/Lista de países por população – Wikipédia, a enciclopédia livre.html")
dados_html[0].head()
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
import pandas as pd
dados_html = pd.read_html("/content/Lista de países por população – Wikipédia, a enciclopédia livre.html")
dados_html[0].head()
Oi, Bárbara! Como vai?
Agradeço por compartilhar seu código com a comunidade Alura.
Com base no que você explicou, chamou atenção o uso do read_html para extrair tabelas diretamente de um arquivo HTML, o que mostra que você entendeu bem como o Pandas consegue transformar dados da web em DataFrames de forma pratica.
Uma dica interessante para o futuro é usar o metodo shape para entender rapidamente o tamanho da tabela carregada. Veja este exemplo:
import pandas as pd
dados_html = pd.read_html("pagina.html")
tabela = dados_html[0]
print(tabela.shape)
Esse código mostra quantas linhas e colunas existem na tabela, ajudando a validar se os dados foram lidos corretamente.