[Projeto] Com eu fiz.

dados2_html = pd.read_html('https://pt.wikipedia.org/wiki/Lista_de_pa%C3%ADses_por_popula%C3%A7%C3%A3o') dados2_html type(dados2_html) len(dados2_html) df_tabela = dados2_html[0] df_tabela populacao_paises = df_tabela[['País (ou território dependente)', 'Estimativa da ONU']] populacao_paises populacao_paises.to_html('populacao_paisess.html') populacao_paises.to_csv('populacao_paises.csv', index=False) pd.read_csv('/content/populacao_paises.csv')

Olá, Roger! Como vai?

Muito bem! Continue resolvendo os desafios e compartilhando com a comunidade Alura.

Observei que você leu a tabela de uma página da web corretamente ao usar o método read_html() posteriormente com o índice [0], selecionou muito bem as colunas no trecho df_tabela[['País (ou território dependente)', 'Estimativa da ONU']] e ainda conseguiu salvar um arquivo em html.

Uma dica interessante para o futuro é usar o parâmetro encoding='utf-8-sig' ao salvar o arquivo CSV. Dessa forma:

populacao_paises.to_csv('populacao_paises.csv', index=False, encoding='utf-8-sig')

Esse pequeno detalhe adiciona um Byte Order Mark (BOM) no início do arquivo, tornando ele compatível com o Excel e com ferramentas que não interpretam UTF-8 puro corretamente, como o MySQL Workbench no Windows.

Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

[Documentação] - codecs — Codec registry and base classes

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP