Onde podemos encontra-los?
Onde podemos encontra-los?
Olá, João Toledo, tudo bem?
O segundo link ainda é possível ter acesso para fazer os testes que o professor apresentou, mas por ser uma aula extra o aluno está mais do que convidado a buscar outras fontes onde podemos extrair as tabelas em html.
Por exemplo, podemos aplicar os conteudos passados dentro da aula para uma página do Wikipédia. Vamos treinar com a página do Lista de unidades federativas do Brasil por população é possível importar a tabela e ver a quantidade de tabelas detectadas através do seguintes códigos:
df_html = pd.read_html('https://pt.wikipedia.org/wiki/Lista_de_unidades_federativas_do_Brasil_por_popula%C3%A7%C3%A3o')
len(df_html)
Logo abaixo, podemos ver a leitura da primeira tabela e como ela se apresentará depois de colocar o seguinte código:
df_html[0]
Saída:
Posição | Unidade federativa | População | % da pop. total | País comparável (habitantes) | |
---|---|---|---|---|---|
0 | 1 | São Paulo | 46 289 333 | 21,9% | Espanha (46 439 864) |
1 | 2 | Minas Gerais | 21 292 666 | 10,1% | Sri Lanka (20 675 000) |
2 | 3 | Rio de Janeiro | 17 366 189 | 8,2% | Países Baixos (16 922 900) |
3 | 4 | Bahia | 14 930 634 | 7,1% | Chade (14 037 000) |
4 | 5 | Paraná | 11 516 840 | 5,4% | Bolívia (11 410 651) |
restante da tabela omitida
Da mesma forma, podemos ver a 2 tabela e como que ela se apresenta:
df_html[1]
Saída:
Posição | Região | População | % da pop. total | País comparável (habitantes) | |
---|---|---|---|---|---|
0 | 1 | Região Sudeste | 89 012 240 | 42,04% | República Democrática do Congo (86 790 567) |
1 | 2 | Região Nordeste | 57 374 243 | 27,09% | África do Sul (58 775 022) |
2 | 3 | Região Sul | 30 192 315 | 14,26% | Nepal (29 609 623) |
3 | 4 | Região Norte | 18 672 591 | 8,82% | Cazaquistão (18 574 680) |
4 | 5 | Região Centro-Oeste | 16 504 303 | 7,79% | Senegal (16 209 125) |
Experimente testar com tabelas de outros links e qualquer dúvida é só usar o fórum!
Abraços e bons estudos!