1
resposta

Obtendo lista de HTML

Quando o HTML tiver mais de um tabela, por exemplo, vamos supor que tenha a tabela1, tabela2 e tabela3 como faço para obter somente a tabela2

Agradeço o apoio.

1 resposta

Olá Fernando, tudo bem? Espero que sim!

Ao utilizar a função pd.read_html(), é gerada uma lista com todas as tabelas do código HTML, e podemos acessar as tabelas de forma isolada utilizando a referência do índice nessa lista.

Suponha que seja armazenenado as tabelas de um HTML em uma variável dados, como no código a seguir:

dados = pd.read_html(url)

Podemos acessar a primeira tabela através de dados[0], a segunda tabela através de dados[1] e assim por diante. Vale lembrar que o índice de uma lista em Python começa em 0, portanto caso queiramos acessar somente a tabela 2, precisamos utilizar dados[1].

Portanto você pode armazenar em uma nova variável ou ainda substituir a variável original pela tabela do seu desejo, caso não necessite das outras tabelas posteriormente.

Pode ser usado um dos códigos a seguir, dependendo da sua escolha:

dados = pd.read_html(url)
tabela2 = dados[1]

ou

dados = pd.read_html(url)
dados = dados[1]

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!