1
resposta

[Projeto] Com eu fiz.

dados2_html = pd.read_html('https://pt.wikipedia.org/wiki/Lista_de_pa%C3%ADses_por_popula%C3%A7%C3%A3o')

dados2_html

type(dados2_html)

len(dados2_html)

df_tabela = dados2_html[0]
df_tabela

populacao_paises = df_tabela[['País (ou território dependente)', 'Estimativa da ONU']]

populacao_paises

populacao_paises.to_html('populacao_paisess.html')

populacao_paises.to_csv('populacao_paises.csv', index=False)

pd.read_csv('/content/populacao_paises.csv')
1 resposta

Olá, Roger! Como vai?

Muito bem! Continue resolvendo os desafios e compartilhando com a comunidade Alura.

Observei que você leu a tabela de uma página da web corretamente ao usar o método read_html() posteriormente com o índice [0], selecionou muito bem as colunas no trecho df_tabela[['País (ou território dependente)', 'Estimativa da ONU']] e ainda conseguiu salvar um arquivo em html.

Uma dica interessante para o futuro é usar o parâmetro encoding='utf-8-sig' ao salvar o arquivo CSV. Dessa forma:

populacao_paises.to_csv('populacao_paises.csv', index=False, encoding='utf-8-sig')

Esse pequeno detalhe adiciona um Byte Order Mark (BOM) no início do arquivo, tornando ele compatível com o Excel e com ferramentas que não interpretam UTF-8 puro corretamente, como o MySQL Workbench no Windows.

Ícone de sugestão Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!