1
resposta

Desafio: lendo uma tabela de uma página web

import pandas as al
url = 'https://pt.wikipedia.org/wiki/Lista_de_pa%C3%ADses_por_popula%C3%A7%C3%A3o'
dados = al.read_html(url)
df_populacao = dados[0]
df_reduzido = df_populacao[['País (ou território dependente)', 'Estimativa da ONU']]
df_reduzido.head()
1 resposta

Olá, Thamiris! Como vai?

Muito bem! Continue resolvendo os desafios e compartilhando com a comunidade Alura.

Observei que você explorou o uso do read_html() para coletar dados diretamente de uma página da web e utilizou muito bem o acesso a tabelas por índice para selecionar a informação desejada.

Uma dica interessante para o futuro é usar rename() para padronizar os nomes das colunas ao trabalhar com dados da web. Dessa forma:

df_reduzido = df_reduzido.rename(columns={'País (ou território dependente)': 'País', 'Estimativa da ONU': 'População'})

Resultado: As colunas agora têm nomes mais simples e prontos para uso em análises e visualizações.

Isso faz com que seu código fique mais limpo e facilite o uso posterior em gráficos, agrupamentos e filtros.

Ícone de sugestão Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!