Oi, Alexandre! tudo bem??
Quando nós utilizamos a função read_html
, procuramos em um documento HTML ou página web a tag <table>
e alguns elementos específicos de uma tabela. Então, as tabelas encontradas são armazenadas em uma lista. E aí você consegue visualizar essas tabelas da lista, indicando a posição que você deseja, assim como você fez no código da primeira imagem.
Certamente, nesse endereço que você tentou utilizar diretamente do site, a tabela não estava com uma formatação que a função read_html
conseguiu entender.
Tente, por exemplo, ler essa página Wikipédia.
Aqui nós temos algumas informações sobre as unidades federativas do brasil. Se você ler a primeira tabela com a biblioteca Pandas, o resultado será assim:
(obs: só deixei as primeiras linhas do DataFrame)
index | Posição | Unidade federativa | População(Censo de 2010)[2] | População(Prévia 2022) | Mudança | % da pop. total | País comparável (habitantes) |
---|
0 | 1 | São Paulo | 41 262 199 | 46 024 937 | +11.5% | 22,2% | Espanha (46 754 778) |
1 | 2 | Minas Gerais | 19 597 330 | 20 732 660 | +5.8% | 10,0% | Burquina Fasso (20 903 273) |
2 | 3 | Rio de Janeiro | 15 989 929 | 16 615 526 | +3.9% | 8,0% | Camboja (16 718 965) |
3 | 4 | Bahia | 14 016 906 | 14 659 023 | +4.6% | 7,1% | Zimbabwe (14 862 924) |
4 | 5 | Paraná | 10 444 526 | 11 835 379 | +13.3% | 5,7% | Tunísia (11 818 619) |
Nesse caso deu certo, pois a página certamente está com os códigos HTML de uma forma que a função read_html
consegue entender isso como uma tabela.
Inclusive, é possível inspecionar o código de uma página ao clicar com o botão direito do mouse e ir na opção inspecionar. E aí, conseguimos ter a visualização abaixo.
Onde fiz a busca da tag <table>
ele mostra onde as tabelas da página estão:
Espero que a explicação tenha ajudado :)